色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<cite id="e6yom"></cite>

<ul id="e6yom"></ul>

<kbd id="e6yom"></kbd>

<dfn id="e6yom"></dfn>

登錄注冊寫文章

Python爬蟲過程中出現(xiàn)中文解碼出現(xiàn)亂碼的現(xiàn)象

Python爬蟲過程中出現(xiàn)中文解碼出現(xiàn)亂碼的現(xiàn)象

諸如類似的代碼：

……

texts = bs.find_all('div',class='content_element').p.text.strip()

???? print(texts)

……

搜索的內(nèi)容中有中文的情況下，python包BeautifulSoup解碼網(wǎng)頁的時候默認應該是使用了gbk進行編碼

通過此代碼可以看出

……

r=requests.get(link,headers=headers)

Print(r.encoding)

……

可以顯示編碼格式為iso-8859-1

因此我在代碼中定義的headers中沒有說明網(wǎng)頁頭文件中的編碼格式，以下圖片為非標準格式瀏覽器頭部文件

一般標準的頭部文件格式：

? ?

《HTTP權威指南》里第16章國際化里提到，如果HTTP響應中Content-Type字段沒有指定charset，則默認頁面是'ISO-8859-1'編碼。這處理英文頁面當然沒有問題，但是中文頁面，就會有亂碼了！

前面已經(jīng)說明如何查看當前編碼格式的方法，下面就說一下遇見此類問題該如何進行解決和糾正

首先因為使用的查看IDE中使用的解碼格式是utf-8的，之前網(wǎng)頁中默認使用的編碼格式也是utf-8的，所以我們必須將其解碼成utf-8格式的字符才能正常顯示中文

使用之前的代碼進行此操作：

texts = bs.find_all('div',class='content_element').p.text.strip().encode(‘iso-8859-1’).decode(‘utf-8’)

???? print(texts)

或者在之前進行encoding=‘utf-8’解碼修正

……

r=requests.get(link,headers=headers)

r=encoding=’utf-8’

print(r.encoding)

……

參考網(wǎng)站：

? ?https://www.cnblogs.com/ccsx/p/8572735.html

? ?https://www.cnblogs.com/surecheun/p/9694052.html

? ?https://www.cnblogs.com/bw13/p/6549248.html

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

深入分析 Java 中的中文編碼問題http://www.ibm.com/developerw...
編碼問題一直困擾著開發(fā)人員，尤其在 Java 中更加明顯，因為 Java 是跨平臺語言，不同平臺之間編碼之間的切換...
x360閱讀 2,581評論 1贊 20
[轉(zhuǎn)載]Python HTTP庫requests中文頁面亂碼解決方案！
Python中文亂碼，是一個很大的坑，自己不知道在這里遇到多少問題了。還好通過自己不斷的總結(jié)，現(xiàn)在遇到亂碼的情況越...
dopami閱讀 2,124評論 0贊 0

字符、編碼和Java中的編碼
字符是用戶可以讀寫的最小單位。計算機所能支持的字符組成的集合，就叫做字符集。字符集通常以二維表的形式存在。二維表的...
劉惜有閱讀 8,395評論 2贊 14
[轉(zhuǎn)] UTF-8編碼的詳細講解
UTF-8 編碼提供了一種簡便而向后兼容的方法, 使得那種完全圍繞 ASCII 設計的操作系統(tǒng), 比如 Unix,...
謝大見閱讀 5,002評論 0贊 3
澄凈的藍天
解釋？哭泣？求饒？她不屑地抬起頭眼眸里是一片澄凈的藍天這塵世何曾被她放在眼里？她在自己的世界那世界如...
夢雙眸閱讀 346評論 4贊 12

友情鏈接更多精彩內(nèi)容

贊1贊

贊賞

手機看全文

屯昌县| 禄劝| 黄大仙区| 江都市| 分宜县| 南和县| 陆川县| 卢龙县| 亚东县| 芮城县| 高雄县| 策勒县| 玉田县| 林甸县| 临夏县| 平昌县| 黑龙江省| 靖西县| 彭山县| 岢岚县| 鱼台县| 耿马| 克山县| 公安县| 彩票| 宁夏| 安阳县| 江津市| 汶川县| 长乐市| 武川县| 新和县| 阆中市| 临安市| 黔西县| 绥阳县| 广河县| 同心县| 舟曲县| 民县| 呼玛县|

<kbd id="guc68"></kbd>