穿漢服的女孩是真的好看,一不小心進入某網址,徹底改變了我的人生價值觀,還爬什么其他妹子,就一個字,爬她,爬它,就爬她!

梅開二度,作為爬圖小能手的我又來啦,這次帶給大家的是精美的漢服,我真的是太喜歡這種傳統(tǒng)服飾了,為了收藏一波,所以就爬了某站,你們覺得也喜歡的話,也可以收藏一波!
漢服爬取
這次的網站比較簡單,所以爬蟲代碼也簡單了不少。零基礎的我覺得也能看懂,實在不行,我放入全部代碼,嘿嘿,保證我有的妹子,你們也要有!
抓取漢服:
第一步:分析網站
第二步:獲得子網站鏈接
第三步:獲得標題和圖表網址
第四步:打包下載圖片
第五步:編寫主函數
第六步:欣賞圖集
第七布:打開淘寶
第一步:分析網站
網址如下:http://www.aihanfu.com/zixun/tushang-1/
這是第一頁的網址,根據觀察,第二頁網址也就是序標1變成了序標2,依次類推,就可以訪問全部頁數。

第二步:獲得子網站鏈接:
圖就是我上面的那張圖,這里可以用soup或者re或者xpath都行的,我比較喜歡用xpath來定位,編寫定位函數,獲得每個子網站鏈接,然后返回主函數,這里使用了一個技巧,在for循環(huán)中,你們可以看看!

第三步:獲得標題和圖表網址:

我們點開一個網址鏈接,如圖所示:
可以發(fā)現標題在head的節(jié)點里面,那這個時候有人肯定會問,要標題干嘛,
這個創(chuàng)建文件夾的時候需要,不然用0,1,2,3表示多俗氣。
圖表下載網址在我所指的箭頭方向,那些節(jié)點打開都是相同的規(guī)律。
這里我就不累贅表示了。


第四步:打包下載圖片:

因為從鏈接我發(fā)現這個網址的圖片質量還過得去,如果你們追求高清圖片,要4k圖,那你們可以點擊這篇博客?真4k抓取?里面有講到怎么抓4k的方法,所有網站都是適用的。

第五步:編寫主函數:
個人感覺這個網站真的很簡單,基本沒怎么出bug,一次性的寫完了。

第六步: 欣賞圖集:
我抓圖絕大部分就是用來作壁紙的,或者滿足我自己的需求,其他方向我也不知道能干什么,對于爬蟲來說,抓圖片或許是最簡單的一個片面,但也是最幸福的方向!
第七步: 打開淘寶:
抓完了,發(fā)現一件特別好看的漢服,打開淘寶一看999,告辭,等等,我沒有女朋友啊,我買這個干嘛,但凡有一粒花生米,我也不會來抓漢服送女友了。
求關注,求點贊,求三連,你的支持是我最大的動力哈!亦可加我的QQ爬蟲交流群群:657485271,大家一起學習交流、