Python爬蟲之煎蛋網(wǎng)圖片下載

受程序員群的影響(自己污的本性),他們總是帶我開車,想想我也該收集一些資料了(美女圖片)

代碼

import requests
from lxml import etree

urls = ['http://jandan.net/ooxx/page-{}'.format(str(i)) for i in range(0,20)]
path = 'C://Users/Administrator/Desktop/煎蛋網(wǎng)/'

header = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}

def get_photo(url):
    html = requests.get(url)
    selector = etree.HTML(html.text)
    photo_urls = selector.xpath('//p/a[@class="view_img_link"]/@href')
    for photo_url in photo_urls:
        data = requests.get('http:'+photo_url,headers=header)
        fp = open(path + photo_url[-10:],'wb')
        fp.write(data.content)
        fp.close()

for url in urls:
    get_photo(url)

我以前做個視頻,這次用不了,出錯,爬蟲只有進行時啊!?。?!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,922評論 25 709
  • 1.確定kin碼 查找年份對照表,找出年月對應的數(shù)字; 將這兩個數(shù)字與日期數(shù)字相加,若和為260以內(nèi)的數(shù)字,則該數(shù)...
    四季橄欖閱讀 948評論 3 2
  • 今年10月份,剛剛拍完婚紗照?;槠陬A訂是明年開春,卻被這些“人造”的好日子,好時辰全部打亂。雙十二,全民狂歡的日子...
    Vici_G閱讀 256評論 0 0
  • 離婚后的每一個噩夢都是在釋放曾經(jīng)壓抑的傷痛。不懂愛不敢愛不會愛,其實都是成長過程中太缺愛的原因,可是我唯一的錯就是...
    破碎的小孩閱讀 238評論 0 1
  • 項目需求: 結(jié)構(gòu)化的目的:由于文檔、query中的信息都是參數(shù)化是人可讀,但機器不方便機器自動化處理,所以需要結(jié)構(gòu)...
    活著活法閱讀 1,008評論 0 2

友情鏈接更多精彩內(nèi)容