以上資料借鑒而已

今天寫個簡單的靜態(tài)的爬蟲爬取IP ip網(wǎng)址
以下我們觀察一下網(wǎng)頁HTML

1504363816(1).png
//*[@id="gallery"]/div[2]/div[1]/div[2]/div[2]/table/tbody/tr[1]/td[2]
這是我用瀏覽器自帶工具提取的xpath大家應(yīng)該發(fā)現(xiàn)了其中帶有tobody,做過爬蟲的大家都知道,一般tobody是瀏覽器自動產(chǎn)生的,一般情況要去掉,為此我耽誤三個小時調(diào)試,一直匹配不到數(shù)據(jù),后來我打印了request反應(yīng)的網(wǎng)頁源碼,里面就是有tobody的

爬取的截圖.png

尼瑪
請別攔著我,我要砍死這個網(wǎng)頁的程序猿!?。。。銈冊趺床粩r我…………)
后來改了一下匹配的格式就爽了

代碼.png
代碼的路,坑坑不絕,坑坑不休------------
好了,以上就寫這么多了,當(dāng)作筆記。
對了,最后放個養(yǎng)眼的圖片
