
本書(shū)講解了如何使用 Python 來(lái)編寫網(wǎng)絡(luò)爬蟲(chóng)程序,內(nèi)容包括網(wǎng)絡(luò)爬蟲(chóng)簡(jiǎn)介,從頁(yè)面中抓取數(shù)據(jù)的 3 種方法,提取緩存中的數(shù)據(jù),使用多個(gè)線程和進(jìn) 程進(jìn)行并發(fā)抓取,抓取動(dòng)態(tài)頁(yè)面中的內(nèi)容,與表單進(jìn)行交互,處理頁(yè)面中的 驗(yàn)證碼問(wèn)題,以及使用 Scarpy 和 Portia 進(jìn)行數(shù)據(jù)抓取,并在最后介紹了使用 本書(shū)講解的數(shù)據(jù)抓取技術(shù)對(duì)幾個(gè)真實(shí)的網(wǎng)站進(jìn)行抓取的實(shí)例,旨在幫助讀者 活學(xué)活用書(shū)中介紹的技術(shù)。 本書(shū)適合有一定 Python 編程經(jīng)驗(yàn)而且對(duì)爬蟲(chóng)技術(shù)感興趣的讀者閱讀。
下載地址:?百度云盤?提取碼: q37e
下載地址:藍(lán)奏云盤