盤點(diǎn)一個Python網(wǎng)絡(luò)爬蟲過程中中文亂碼的問題

大家好,我是皮皮。

一、前言

前幾天在Python黃金交流群有個叫【Mt.Everest】的粉絲問了一個關(guān)于Python網(wǎng)絡(luò)爬蟲過程中中文亂碼的問題,這里拿出來給大家分享下,一起學(xué)習(xí)。

image.png

二、解決過程

這個問題其實(shí)很早之前,我就寫過相關(guān)文章,而且屢試不爽。

image.png
【Python進(jìn)階者】解答

這里給出了兩個思路,照著這個思路去的話,問題不大。

image.png

事實(shí)上并不巧,還是翻車了。

【黑臉怪】解答

許多群友也嘗試去運(yùn)行代碼解決,但是還是翻車了,好在有【黑臉怪】大佬。

image.png

【黑臉怪】大佬一出手,就知道有沒有。

image.png

看上去確實(shí)是搞定了,真是太強(qiáng)了。

image.png

其實(shí)這里【黑臉怪】大佬把params這個參數(shù)去掉了,其他的就沒做了。

image.png

后來【Mt.Everest】親測,確實(shí)可以了!

image.png

后來仔細(xì)看了下response數(shù)據(jù),發(fā)現(xiàn)確實(shí)是不需要加params參數(shù)。

image.png

后來問題迎刃而解了。

image.png

小伙伴們直呼好家伙!

image.png

三、總結(jié)

大家好,我是皮皮。這篇文章基于粉絲提問,針對一個Python網(wǎng)絡(luò)爬蟲過程中中文亂碼的問題,給出了具體說明和演示。其實(shí)來說的話,使用r.encoding = r.apparent_encoding編碼方式可以解決大多數(shù)的中文亂碼問題,但是一些細(xì)節(jié)方面還是需要多多注意的。

最后感謝粉絲【Mt.Everest】提問,感謝【黑臉怪】大佬給出的示例和代碼支持,感謝粉絲【孫文】、【PI】、【dcpeng】、【東哥】、【磐奚鳥】、【??(這是月亮的背面)】等人參與學(xué)習(xí)交流。

小伙伴們,快快用實(shí)踐一下吧!如果在學(xué)習(xí)過程中,有遇到任何問題,歡迎加我好友,我拉你進(jìn)Python學(xué)習(xí)交流群共同探討學(xué)習(xí)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容