1.爬取一張圖片

在看了一些HTTP協(xié)議和Python基礎(chǔ)語法之后,發(fā)現(xiàn)爬取數(shù)據(jù)并沒有之前想象中那么難。
千里之行始于足下,我先定個小目標,比如爬取百度首頁的Logo。

# 比如我要把百度的logo圖片爬取下來,并把圖片存儲到本地
import requests

response = requests.get('https://ss0.bdstatic.com/5aV1bjqh_Q23odCf/static/superman/img/logo/bd_logo1_31bdc765.png')
content = response.content
with open('E:/爬取的數(shù)據(jù)/1.png', 'wb') as f:
    f.write(content)
    f.close()

首先要倒入requests庫,里面包含了對網(wǎng)頁的一些請求操作。具體我現(xiàn)在也不清楚,不過以后會知道的。

1、首先要知道這個圖片的URL
打開百度首頁,按F12審查頁面元素。如下圖


image.png

再選中2號紅框中的百度圖片時,會發(fā)現(xiàn)下面<img>標簽被選中了,這是瀏覽器告訴你就是這條HTML代碼來渲染的這個圖片。
src屬性告訴我們這個圖片的URL是多少。

2、把這個URL傳給requests.get()函數(shù),得到的就是請求返回的response。
3、通過content屬性來獲取response的內(nèi)容
4、利用open()和write()函數(shù)寫入本地指定路徑的文件中。

存儲圖片時有一點很有趣,URL中指定圖片時png格式的,但是我測試保存成jpg格式也是可以打開的。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容