編碼轉換之“中”字

unicode

\u4e2d

ascii碼

\u4e2d

\ -> 92

u -> 117

4 -> 52

e -> 101

2 -> 50

d -> 100

utf8

utf8是unicode另一種表式

#十六進制實體
中

4e2d十進制

#十進制實體
中

4e2d -> 20013

4e2d二進制

0100 1110 0010 1101

4 -> 0100

e -> 1110

2 -> 0010

d -> 1101

utf8

第一個字節(jié)

  • 前三位是 111,表示這是一個三字節(jié)的 UTF-8 字符。
  • 接下來的 4 位(xxxx)是 Unicode 碼點 0100 1110 0010 1101 的前 4 位

第二個字節(jié)

  • 前兩位是 10,表示這是一個 UTF-8 的后續(xù)字節(jié)。
  • 接下來的 6 位是 Unicode 碼點接下來的 6 位,即 1110 0010(從 Unicode 碼點中跳過已經(jīng)用于第一個字節(jié)的 4 位)。

第三個字節(jié)

  • 前兩位是 10,表示這是 UTF-8 的另一個后續(xù)字節(jié)。
  • 接下來的 6 位是 Unicode 碼點剩下的 6 位,即 1011 0101。

1110 0100

10 1110 00

10 10 1101

三字節(jié)轉換

二進制

11100100 10111000 10101101

16進制

E4 B8 AD

11100100 -> E4

10111000 -> B8

10101101 -> AD

url編碼

%E4%B8%AD

ascii碼

45 34 42 38 41 44
#unicode
\u0045\u0034\u0042\u0038\u0041\u0044

E -> 45

4 -> 34

B -> 42

8 -> 38

A -> 41

D -> 44

十進制實體

E4B8AD

45 -> 69

34 -> 52

42 -> 66

38 -> 56

41 -> 65

44 -> 68

C# byte(10進制)

228 184 173

十進制

11100100 -> 228

10111000 -> 184

10101101 -> 173

java byte

基于ISO-8859-1字符集(Java使用平臺的默認字符集),用補碼。

-28 -72 -83

對應的原碼(即該負數(shù)的絕對值),我們需要執(zhí)行以下步驟:

  1. 對除了符號位之外的所有位取反(即0變1,1變0)。
  2. 將取反后的結果加1。

11100100 -> 00011100 -> -28

10111000 -> 01001000 -> -72

10101101 -> 01010011 -> -83

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容