網(wǎng)頁圖片爬蟲

import urllib

import urllib.request

import? re #正則表達式

def load_page(url):

? ? request=urllib.request.Request(url)#發(fā)送網(wǎng)絡請求

? ? response=urllib.request.urlopen(request)#根據(jù)url打開頁面

? ? data=response.read()#獲取頁面響應數(shù)據(jù)

? ? return? data#返回響應數(shù)據(jù)

def get_image(html):

? ? regx=r'http://[\S]*jpg'#存儲正則表達式

? ? pattern=re.compile(regx)#編譯表達式構造匹配模式

? ? get_image=re.findall(pattern,repr(html))#進行正則匹配并返回結果

? ? num=1

? ? #遍歷獲取的圖片

? ? for img in get_image:

? ? ? ? image=load_page(img)

? ? ? ? #將圖片存入到指定文件夾

? ? ? ? with open('D:\\photo\\%s.jpg' %num,'wb')as fb:

? ? ? ? ? ? fb.write(image)

? ? ? ? ? ? print('正在現(xiàn)在第%s張圖片' %num)

? ? ? ? ? ? num=num+1

? ? print("下載完成")

url='http://p.weather.com.cn/2018/01/2832905.shtml#p=1'

html=load_page(url)

get_image(html)

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,554評論 19 139
  • 本內容為《用Python寫網(wǎng)絡爬蟲》書籍內容,有興趣的讀者可以購買本書,本章的代碼皆可在Python3中運行。為了...
    海人為記閱讀 2,372評論 0 5
  • Python爬蟲入門(urllib+Beautifulsoup) 本文包括:1、爬蟲簡單介紹2、爬蟲架構三大模塊3...
    廖少少閱讀 10,083評論 0 6
  • 正值冬天,好多日受到霧霾侵襲,甚是憂郁,幸好一場冬雨,使陽光再現(xiàn),也給我們觸摸冬天的機會。 于是到公園走走,停停,...
    小苜蓿閱讀 574評論 4 11
  • 一個小時了 還是睡不著 心中慌亂 煩躁o(*≧д≦)o!!起來看書 看不進 放著鋼琴曲也無法入眠 自己生自己的氣 ...
    夢尛潔閱讀 222評論 0 0

友情鏈接更多精彩內容