Python實(shí)戰(zhàn)計(jì)劃學(xué)習(xí)筆記1.4:爬取http://weheartit.com/inspirations/taylorswift圖片

代碼:

from bs4 import BeautifulSoup
import requests
import time
import urllib.request

path = "C:\\\\Users\\\\album\\\\Desktop\\\\tylor\\\\"
base_url ='http://weheartit.com/inspirations/taylorswift?page'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36'
}

def get_links(num):
    photo_links = []
    for page_num in range(1, num + 1):
        full_url = base_url + str(page_num)
        wb_data = requests.get(full_url)
        soup = BeautifulSoup(wb_data.text, 'lxml')
        time.sleep(2)
        images = soup.select('img.entry-thumbnail')
        for image in images:
            photo_links.append(image.get('src'))

    return photo_links



def dl_image(url):
    urllib.request.urlretrieve(url, path + url.split('/')[-2] + url.split('/')[-1])
    print('Done')


for url in get_links(4):
    dl_image(url)

總結(jié):

用urllib.request.urlretrieve()下載圖片

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容