ASCII:一個英文字母占一個字節(jié)。一個漢字占兩個字節(jié)。
utf-8:一個英文字符占一個字節(jié)。一個中文等于3個字節(jié)。
unicode:一個英文等于兩個字節(jié),一個中文等于兩個字節(jié)。
符號:英文標(biāo)點占一個字節(jié),中文標(biāo)點占兩個字節(jié)。
空格
ANSI(ASCII.GB2312.GBK等) 占一個字節(jié)。
utf-16: 兩個字節(jié)。
utf-32:四個字節(jié)
utf-8:一個字節(jié)
unicode有兩個,ucs-2.usc-4
ucs-2相當(dāng)于utf-16
usc-4相當(dāng)于utf-32
創(chuàng)建測試文本
echo "Test file thing">test.txt