熟女人妻在线,日本一本高清视频

弄不清楚findAll和find_all的區(qū)別。

幾點(diǎn)收獲

使用 find_all取獲取目標(biāo)鏈接
使用urllib庫下載圖片，貌似更簡便
獲取圖片鏈接地址時(shí)要注意，后面一個(gè)圖片往往是未加載完成時(shí)顯示的“正在加載”的圖片，要注意區(qū)分
爬回的鏈接中有個(gè)把不符合條件，截取鏈接最后幾個(gè)字符用 in 判斷是否是jpg或gif，不是就直接pass
其他方面沒有難度
下次多選取頁碼范圍，下載圖片的時(shí)候可以用多線程。

import requests
from urllib import request
from bs4 import BeautifulSoup
#構(gòu)建目標(biāo)網(wǎng)站鏈接
urls=["http://www.doutula.com/photo/list/?page={}".format(str(i)) for i in range(1,3)]
def get_srcs(url):   #獲取圖片鏈接
    src=[]
    html=requests.get(url)
    soup=BeautifulSoup(html.text,'lxml')
#以下為最關(guān)鍵一句
    srcs=soup.find_all('img',attrs={'class':'img-responsive lazy image_dta'})
    for i in srcs:
        src.append(i['data-original'])  #返回?cái)?shù)組，想用yield，但是沒弄明白。
    return src

def down_pic(src):   #下載圖片
    root='d:/py/spider/doutuphoto/'
    if src[-3:] in ['jpg','gif']:
        request.urlretrieve(src,filename=root+src.split('/')[-1])
    else:
        pass

def main():
    for url in urls:
        for i in get_srcs(url):   #此處可加多線程
            down_pic(i)
            print (i)
if __name__=='__main__':
    main()

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

beautifulsoup的find_all用法，爬取斗圖網(wǎng)圖片

beautifulsoup的find_all用法，爬取斗圖網(wǎng)圖片

弄不清楚findAll和find_all的區(qū)別。

幾點(diǎn)收獲

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

beautifulsoup的find_all用法，爬取斗圖網(wǎng)圖片

弄不清楚findAll和find_all的區(qū)別。

幾點(diǎn)收獲

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

beautifulsoup的find_all用法，爬取斗圖網(wǎng)圖片

弄不清楚findAll和find_all的區(qū)別。