伊人一区二区三区无码,91色亚洲

小試牛刀--Python爬蟲BeautifulSoup使用

python爬數(shù)據(jù)小試牛刀--beautifulSoup使用

1.環(huán)境配置

編譯環(huán)境：python 2.7
編譯器：pycharm
HTML或XML提取工具：beautifulSoup(安裝自行百度)

2.網(wǎng)站分析

網(wǎng)站：斗魚（http://www.douyu.com）
爬取目標：首頁的圖片
步驟一：查看圖片信息，鼠標右鍵圖片，選擇檢查
image

檢查
步驟二：分析發(fā)現(xiàn)圖片連接都在src下面
步驟三：代碼編寫
導入庫

 import urllib
 from  bs4  import BeautifulSoup

獲取網(wǎng)頁

 import urllib
from  bs4  import BeautifulSoup
f=urllib.urlopen("http://www.douyu.com")
html =f.read()
soup = BeautifulSoup(html, 'html.parser')

匹配查詢

ss=soup.find_all('img')
print ss
lenth=int(len(ss))
print lenth
for i in range(lenth):
    url =ss[i].attrs['src']
    print url
    tad=url.rfind('.')
    print tad
    if tad>0:
       str= url[tad+1:tad+4]
       if str=='png':
           print "this is png"
           urllib.urlretrieve(url, './img2/png%d.png'%i)
       elif str=='jpg':
           print 'this is jpg'
           urllib.urlretrieve(url, './img2/img%d.jpg' % i)
       elif str=='gif':
           print "this is gif"
           urllib.urlretrieve(url, './img2/gif%d.gif' % i)
       else:print "Error"

3.總結

獲取圖片的過程中，發(fā)現(xiàn)圖片有jpg,png,和gif,于是通過字符串操作，把格式區(qū)分開來。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成，瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發(fā)布，文章內容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

小試牛刀--Python爬蟲BeautifulSoup使用

小試牛刀--Python爬蟲BeautifulSoup使用

python爬數(shù)據(jù)小試牛刀--beautifulSoup使用

1.環(huán)境配置

2.網(wǎng)站分析

3.總結

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

小試牛刀--Python爬蟲BeautifulSoup使用

python爬數(shù)據(jù)小試牛刀--beautifulSoup使用

1.環(huán)境配置

2.網(wǎng)站分析

3.總結

相關閱讀更多精彩內容

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av