Python實(shí)戰(zhàn)課程第一周第四課:練習(xí)提取一個本地網(wǎng)頁信息

昨天看完教程之后,重新敲了一次代碼,今天開始做后面的練習(xí)題。練習(xí)題基本和課程差不多,目標(biāo)是提取評分高于4星的文章標(biāo)題和評論數(shù)。

我的成果

13.JPG

我的代碼

from bs4 import BeautifulSoup
info = []
with open('E:/1080P/1_2_homework_required/index.html','r') as wb_data:
    Soup = BeautifulSoup(wb_data,'lxml')
#    print(Soup)
    images = Soup.select('body > div > div > div.col-md-9 > div > div > div > img')
    titles = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')
    prices = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
    stars = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)')
    nums = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')
 #   print(stars)
#for star in stars:
 #   print(list(star.find_all("span")))


for title,image,price,star,num in zip(titles,images,prices,stars,nums):
    data = {
    'title':title.get_text(),
    'image':image.get('src'),
    'price':price.get_text(),
    'star': len(star.find_all("span", class_ = 'glyphicon glyphicon-star')),
    'num':num.get_text()
    }
 #   print(data)
    info.append(data)

for i in info:
    if float(i['star'])>4:
        print(i['title'],i['price'])

我的總結(jié)

  1. 練習(xí)題的難點(diǎn)在于那幾個星星的統(tǒng)計(jì)。由于教程上提示可以使用find_all函數(shù)解決,于是我仔細(xì)地看了看教程,先嘗試自己解決。
star.find_all("span")

這是我剛開始的想法,因?yàn)槲铱吹叫切堑木W(wǎng)頁內(nèi)容是這樣的:

<span class="glyphicon glyphicon-star"></span>

上面就代表了一個星星,我還以為find_all能知道幫忙查到有幾個星星,結(jié)果不是。然后我想,是不是要讓這些星星先像列表那樣全部排列出來,然后再統(tǒng)計(jì)有多少個。
搞了好久,我最后還是看了看答案。原來要用到len統(tǒng)計(jì)函數(shù),還要指向class,而且是class_不要忘了后面的" _ "。
還有路徑,我一開始就將不要的東西全刪掉了,原來是要保留最后的部分的。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,802評論 25 709
  • 轉(zhuǎn)至元數(shù)據(jù)結(jié)尾創(chuàng)建: 董瀟偉,最新修改于: 十二月 23, 2016 轉(zhuǎn)至元數(shù)據(jù)起始第一章:isa和Class一....
    40c0490e5268閱讀 2,032評論 0 9
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法,類相關(guān)的語法,內(nèi)部類的語法,繼承相關(guān)的語法,異常的語法,線程的語...
    子非魚_t_閱讀 34,627評論 18 399
  • 不是不會痛,而是覺得不值得,但是想想切覺得傷心
    奈若何夕閱讀 203評論 0 0
  • 【致敬100天后的奔跑的自己,因?yàn)闊o法知道遠(yuǎn)方,所以,前行】 來一桶哥們, 細(xì)思人生一轉(zhuǎn)眼經(jīng)歷90個100天,很多...
    賀小桶閱讀 234評論 2 9

友情鏈接更多精彩內(nèi)容