print() 是函數(shù),不是一個(gè)語(yǔ)句
raw_input()輸入函數(shù),改為 input()
Python 3 對(duì)文本和二進(jìn)制數(shù)據(jù)做了更為清晰的區(qū)分。
1 .文本由unicode表示,為str類(lèi)型
2 .二進(jìn)制數(shù)據(jù)由bytes (字節(jié)包)表示,為bytes類(lèi)型
新增數(shù)據(jù)類(lèi)型 bytes (字節(jié)包),代表二進(jìn)制數(shù)據(jù)以及被編碼的文本字符串前有個(gè)前綴b
Python3中 bytes 與 str 轉(zhuǎn)換
1 .str 可以編碼(encode)成 bytes
2 .bytes 可以解碼(decode)成 str
字符串格式化輸出方式:新增format()方式
dict類(lèi)型變化
之前的
iterkeys(),itervalues(),iteritems(),
改為現(xiàn)在的keys(),values(),items()
字符串編碼格式:
ASCII:早起計(jì)算機(jī)保存英文字符的編碼方式
GB2312:對(duì)ASCII的中文擴(kuò)展
GBK/GB18030:包括了GB2312的所有內(nèi)容,同時(shí)又增加了近20000個(gè)新的漢字和符號(hào)
Unicode:包括了全球的符合和編碼。每個(gè)字符用3~4個(gè)字節(jié)表示,浪費(fèi)空間
UTF-8:可變長(zhǎng)的編碼方式,在互聯(lián)網(wǎng)上使用最廣泛的一種Unicode的實(shí)現(xiàn)方式,根據(jù)語(yǔ)種決定字符長(zhǎng)度,如一個(gè)漢字3個(gè)字節(jié),一個(gè)字母1個(gè)字節(jié),也是Linux環(huán)境下默認(rèn)編碼格式。