unicode
\u4e2d
ascii碼
\u4e2d
\ -> 92
u -> 117
4 -> 52
e -> 101
2 -> 50
d -> 100
utf8
utf8是unicode另一種表式
#十六進制實體
中
4e2d十進制
#十進制實體
中
4e2d -> 20013
4e2d二進制
0100 1110 0010 1101
4 -> 0100
e -> 1110
2 -> 0010
d -> 1101
utf8
第一個字節(jié):
- 前三位是
111,表示這是一個三字節(jié)的 UTF-8 字符。 - 接下來的 4 位(xxxx)是 Unicode 碼點
0100 1110 0010 1101的前 4 位
第二個字節(jié):
- 前兩位是
10,表示這是一個 UTF-8 的后續(xù)字節(jié)。 - 接下來的 6 位是 Unicode 碼點接下來的 6 位,即
1110 0010(從 Unicode 碼點中跳過已經(jīng)用于第一個字節(jié)的 4 位)。
第三個字節(jié):
- 前兩位是
10,表示這是 UTF-8 的另一個后續(xù)字節(jié)。 - 接下來的 6 位是 Unicode 碼點剩下的 6 位,即
1011 0101。
1110 0100
10 1110 00
10 10 1101
三字節(jié)轉換
二進制
11100100 10111000 10101101
16進制
E4 B8 AD
11100100 -> E4
10111000 -> B8
10101101 -> AD
url編碼
%E4%B8%AD
ascii碼
45 34 42 38 41 44
#unicode
\u0045\u0034\u0042\u0038\u0041\u0044
E -> 45
4 -> 34
B -> 42
8 -> 38
A -> 41
D -> 44
十進制實體
E4B8AD
45 -> 69
34 -> 52
42 -> 66
38 -> 56
41 -> 65
44 -> 68
C# byte(10進制)
228 184 173
十進制
11100100 -> 228
10111000 -> 184
10101101 -> 173
java byte
基于ISO-8859-1字符集(Java使用平臺的默認字符集),用補碼。
-28 -72 -83
對應的原碼(即該負數(shù)的絕對值),我們需要執(zhí)行以下步驟:
- 對除了符號位之外的所有位取反(即0變1,1變0)。
- 將取反后的結果加1。
11100100 -> 00011100 -> -28
10111000 -> 01001000 -> -72
10101101 -> 01010011 -> -83