99草综合网,夜夜骚一区二区三区

python中把ISO-8859-1編碼轉(zhuǎn)化為UTF-8

當(dāng)我們爬取一些頁面的中文信息時(shí)，會(huì)出現(xiàn)如下情況：

11.png

爬取的中文編碼格式不是UTF-8,無法正常顯示，查看編碼格式：

12.png

編碼格式為ISO-8859-1（長見識啦~）
我們先定義一個(gè)這種編碼的字符串：

14.png

先編碼

15.png

后解碼

16.png

完整流程

13.png

爬取內(nèi)容變?yōu)橹形?br>

20.png

encode(編碼)：按照某種規(guī)則將“文本”轉(zhuǎn)換為“字節(jié)流”，unicode轉(zhuǎn)化為str

decode(解碼)：將“字節(jié)流”按照某種規(guī)則轉(zhuǎn)換成“文本”，str轉(zhuǎn)化為unicode

s.decode(' ')：運(yùn)行會(huì)出錯(cuò)。因?yàn)閜ython 3中的str類型對象有點(diǎn)像Python 2中的unicode，而decode是將str轉(zhuǎn)為unicode編碼，所以str僅有一個(gè)encode方法，調(diào)用這個(gè)方法后將產(chǎn)生一個(gè)編碼后的byte類型的字符。
AttributeError: 'str' object has no attribute 'decode'
AttributeError: 'bytes' object has no attribute 'encode'

最后編輯于：2018.05.30 16:52:08

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡書系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

python中把ISO-8859-1編碼轉(zhuǎn)化為UTF-8

python中把ISO-8859-1編碼轉(zhuǎn)化為UTF-8

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

python中把ISO-8859-1編碼轉(zhuǎn)化為UTF-8

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av