字符編碼

1 ASCII:American Standard Code for Information Interchange

  • 0~32:用作控制字符
  • 00000000-01111111:其他字符

2 GB2312標(biāo)準(zhǔn)

  • 00000000 00000000:大概能存儲(chǔ)7000左右漢字

2.1 GBK:GB2312的拓展

  • 擴(kuò)展大概多出20000左右字符,包含繁體字、假名、羅馬字符

2.2 GB18030:包含很多少數(shù)名族字符


3 ISO:國(guó)際標(biāo)準(zhǔn)化組織

UCS:Universal Multi-Octet Coded Character Set
UCS俗稱Unicode


4 UTF:Unicode Transfer Format

  • UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位傳輸
  • UTF8表示一個(gè)字符用多少個(gè)字節(jié)不固定
  • 舉例:
    • 如果一個(gè)字符只占一個(gè)字節(jié),表示0xxxxxxx
    • 如果一個(gè)字符占兩個(gè)字節(jié),表示110xxxxx 10xxxxxx
    • 如果一個(gè)字符占三個(gè)字節(jié),表示1110xxxx 10xxxxxx 10xxxxxx
    • 如果一個(gè)字符占四個(gè)字節(jié),表示11111xxx 10xxxxxx 10xxxxxx 10xxxxxx

--

5 正確的寫入寫出方式

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 0 前言 在平時(shí)的開(kāi)發(fā)過(guò)程中大部分人應(yīng)該都遇到過(guò)中文亂碼問(wèn)題,瀏覽網(wǎng)頁(yè)時(shí)也會(huì)遇到內(nèi)容顯示亂碼的情況,一般遇到這種情...
    小豬啊嗚閱讀 2,896評(píng)論 1 10
  • 開(kāi)始記錄我的 2019-Read-Record 記錄一些有意思的知識(shí)點(diǎn)和疑難雜癥。 1 整理字符工作 有這么一幫人...
    NinthDay閱讀 2,693評(píng)論 2 13
  • ANSI、UTF-8、Unicode為字符代碼的三種編碼格式,一個(gè)字符可以被編碼成ANSI、UTF-8或Unico...
    小熊猜猜我有幾顆糖閱讀 33,655評(píng)論 1 8
  • 聚會(huì)松山綠水中,四十未見(jiàn)已霜容。 曾經(jīng)學(xué)校多勤奮,頑少童年戲鳥蟲。 故土難回千萬(wàn)里。他鄉(xiāng)把盞不能同。 興安嶺秀依舊...
    云杉_2e22閱讀 476評(píng)論 2 5
  • 第二章 第一節(jié) 第四段 “謝謝您,雖然我也很想得到幫助,只不過(guò)現(xiàn)在我的腦子很亂……” “不管是名字還是作者...
    雨象閱讀 252評(píng)論 0 0

友情鏈接更多精彩內(nèi)容