Python實戰(zhàn)計劃學(xué)習(xí)筆記:爬取商品信息

這是python實戰(zhàn)的第二次作業(yè),這次學(xué)會了查文檔來進行學(xué)習(xí)

最終成果圖

爬取商品信息結(jié)果.png

我的代碼

__author__ = 'Reborn'

from bs4 import BeautifulSoupimport rewith 

open(r"E:/study/Workspaces/pycharm/source/1_2answer_of_homework/index.html",'r') as ht_data:
    Soup = BeautifulSoup(ht_data,'lxml')
    picadds = Soup.select('body > div > div > div.col-md-9 > div > div > div > img')
    titles = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')
    prices = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
    rates = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p > span')
    nums = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')

star = [];index = 0
for index in range(1,len(rates)):
    string=str(rates[index])
    if re.search("empty",string) != None:
        star.append('☆')    
    else:
        star.append('★')

flag = 0
for picadd,title,price,sta,num in zip(picadds,titles,prices,star,nums):
    data = {        
        'picadd': picadd.get("src"),
        'title' : title.get_text(),
        'price' : price.get_text(),
        'star'  : ''.join(star[flag:flag+4]),
        'num'   : num.get_text()
    }
    flag += 5
    print(data)

我的感悟

  • 現(xiàn)在才學(xué)會把文檔用起來,發(fā)揮它真正的作用
  • 薄弱的基礎(chǔ),還需要多翻幾次課本。多看一些代碼
  • 保持獨立思考,用自己的力量把問題解決
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容