- Unicode的UTF8表示法
中文編碼
GB2312,包含7445個(gè)字,其中6763個(gè)漢字,1980發(fā)布。
GBK兼容GB2312,包含21886個(gè)字,1995發(fā)布
GB18030,兩個(gè)版本,27533/70244個(gè)漢字,2000/2005發(fā)布
Unicode編碼
- 目的:為了包含所有語言的編碼
- 使用4個(gè)字節(jié)來表示
- 包含多個(gè)平面
UTF-8
- 全稱:8-bit Unicode Transformation Format
- 能表示Unicode所有字符
- 變長字符,不同語言的unicode碼轉(zhuǎn)化到UTF-8后的字節(jié)數(shù)可能不同。
字符編碼筆記:ASCII,Unicode和UTF-8