計(jì)算機(jī)常用編碼

計(jì)算機(jī)常用編碼

ASCII編碼

  • 最早的最重要的最基本的英美文字的字符集
  • 只使用最低7位表示字符,剩余的128位留作拓展
  • 采用順序儲(chǔ)存方式儲(chǔ)存字符

ISO-8859-*

  • 使用ASCII剩余的碼位進(jìn)行拓展
  • ISO-8859-1專(zhuān)門(mén)對(duì)英語(yǔ)的拓展
  • Tomcat 默認(rèn)采用ISO-88591>UTF-8

GBK[936]

  • 包括簡(jiǎn)繁字體
  • 包括GB2312字集、BIG5字集
  • GBK編碼是GB2312編碼的超集,向下完全兼容GB2312
  • GBK支持希臘字母、日文假名字母、俄語(yǔ)字母等字符,但不支持韓語(yǔ)中的表音字符(非漢字字符)。

UTF-8

  • 英文使用8位(一個(gè)字節(jié)),中文使用24位(3個(gè)字節(jié))
  • UTF-8包含全世界所有國(guó)家需要用到的字符,是國(guó)際編碼

ANSI

  • ANSI不是一種具體的編碼
  • 由系統(tǒng)默認(rèn)的編碼決定,如果系統(tǒng)默認(rèn)的編碼gbk那ANSI就是gbk
  • 查看系統(tǒng)默認(rèn)編碼在DOS命令窗口輸入 chcp

ASCII碼表

常用09,AZ,az對(duì)應(yīng)的ASCII碼分別為4857,6590,97122

0 -- 48

A -- 65

a -- 97

亂碼產(chǎn)生原因

  • 計(jì)算機(jī)中文件的存儲(chǔ)是以二進(jìn)制的形式保存,在保存到硬盤(pán)上時(shí),計(jì)算機(jī)會(huì)將內(nèi)存中的文件,按照特定的格式[編碼方式]轉(zhuǎn)換為二進(jìn)制文件,保存到硬盤(pán)中。
  • 當(dāng)文件再次打開(kāi)時(shí),計(jì)算機(jī)會(huì)把硬盤(pán)中的二進(jìn)制文件加載到內(nèi)存,按照特定的格式,重新編碼成可讀的普通文件;
  • 重新編碼時(shí),系統(tǒng)會(huì)搜索當(dāng)前系統(tǒng)中,對(duì)于不同后綴名文件的默認(rèn)打開(kāi)方式[每種打開(kāi)方式包含的編碼不一定相同],如果默認(rèn)的打開(kāi)方式中包含的編碼方式與原編碼格式相同,則文件可以正常打開(kāi),沒(méi)有亂碼;
  • 如果默認(rèn)打開(kāi)方式中的編碼不包含,或者沒(méi)有全部包含,則會(huì)出現(xiàn)亂碼

亂碼的解決方式

  • 在保存文件時(shí),確定編輯保存的編碼方式
  • 在打開(kāi)文件時(shí),要根據(jù)不同的文件后綴名,選擇對(duì)應(yīng)的打開(kāi)方式
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容