在爬取前程無(wú)憂(yōu)信息時(shí),使用下面的解析方法出現(xiàn)了信息丟失的問(wèn)題:
html = BeautifulSoup(result,"lxml")
經(jīng)過(guò)查詢(xún)CSDN博客,發(fā)現(xiàn)是’lxml’解析頁(yè)面時(shí)出的問(wèn)題,故此改用下面方法:
html = BeautifulSoup(result,"html.parser") #因?yàn)槭褂?lxml'會(huì)導(dǎo)致內(nèi)容丟失,故此使用'html.parser'
雖然效率可能會(huì)比’lxml’低一些,但是不會(huì)有信息丟失的問(wèn)題了。
下面是博客鏈接地址: