編碼

首先介紹:

由于計(jì)算機(jī)是美國人發(fā)明的,因此,最早只有127個(gè)字母被編碼到計(jì)算機(jī)里,也就是大小寫英文字母、數(shù)字和一些符號,這個(gè)編碼表被稱為ASCII編碼,比如大寫字母A的編碼是65,小寫字母z的編碼是122。

但是,不是所有的文字都是英文,于是各國編碼應(yīng)運(yùn)而生,oh,shit,好亂啊。因此,Unicode應(yīng)運(yùn)而生,決定一同江湖唯我獨(dú)尊。Unicode把所有語言都統(tǒng)一到一套編碼里,這樣就不會(huì)再有亂碼問題。

ASCII編碼和Unicode編碼的區(qū)別:ASCII編碼是1個(gè)字節(jié),而Unicode編碼通常是2個(gè)字節(jié)(生僻字用四個(gè)字符表示)。

噔噔蹬.....

于是有人設(shè)想如果統(tǒng)一成Unicode編碼,那么亂碼問題從此消失了。But,如果你寫的文本基本上全部是英文的話,用Unicode編碼比ASCII編碼需要多一倍的存儲空間,在存儲和傳輸上就十分不劃算。

so,本著節(jié)約的精神,誕生了把Unicode編碼轉(zhuǎn)化為“可變長編碼”的UTF-8編碼。UTF-8編碼把一個(gè)Unicode字符根據(jù)不同的數(shù)字大小編碼成1-6個(gè)字節(jié),常用的英文字母被編碼成1個(gè)字節(jié),漢字通常是3個(gè)字節(jié),只有很生僻的字符才會(huì)被編碼成4-6個(gè)字節(jié)。如果你要傳輸?shù)奈谋景罅坑⑽淖址?,用UTF-8編碼就能節(jié)省空間:

字符??? ASCII???????????????? Unicode??????????????????????????????????????????? UTF-8

A???????? 01000001????????? 00000000? 01000001????????????????? 01000001

中????????? x??????????????????????? 01001110 00101101??????????????????????? 11100100 10111000 10101101

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 字符集和編碼簡介 在編程中常??梢砸姷礁鞣N字符集和編碼,包括ASCII,MBCS,Unicode等字符集。確切的說...
    蘭山小亭閱讀 9,078評論 0 13
  • 三朝回門,卑卑褪下了青狐大衣,里面穿著泥金緞短袖旗袍。人像金瓶里的一朵梔子花。 霜濃月薄的銀藍(lán)的夜里,惟有一兩家店...
    曾昭然閱讀 238評論 1 0
  • 子貢問孔子,有什么是可以終身奉行的呢?孔子說:“??!”緊接著,孔子解釋說,所謂恕,就是“己所不欲,勿施于人?!?《...
    心誠則靈yue閱讀 924評論 0 0
  • 加入溪月確實(shí)是出于對文學(xué)的熱愛,當(dāng)然,也有找樂子的成分,總之,加入了一個(gè)文學(xué)社,一群喜歡寫東西的人在一起。 可能它...
    桀驁少年臣閱讀 602評論 0 0

友情鏈接更多精彩內(nèi)容