BeautifulSoup解析頁(yè)面造成信息丟失的解決辦法

在爬取前程無(wú)憂(yōu)信息時(shí),使用下面的解析方法出現(xiàn)了信息丟失的問(wèn)題:

html = BeautifulSoup(result,"lxml")

經(jīng)過(guò)查詢(xún)CSDN博客,發(fā)現(xiàn)是’lxml’解析頁(yè)面時(shí)出的問(wèn)題,故此改用下面方法:

html = BeautifulSoup(result,"html.parser") #因?yàn)槭褂?lxml'會(huì)導(dǎo)致內(nèi)容丟失,故此使用'html.parser'

雖然效率可能會(huì)比’lxml’低一些,但是不會(huì)有信息丟失的問(wèn)題了。

下面是博客鏈接地址:

BeautifulSoup解析頁(yè)面造成信息丟失的解決辦法 - CSDN博客

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容