python爬取 Book name

代碼:

#coding-utf8
#導(dǎo)入模塊
import requests
from lxml import etree
#網(wǎng)站
url = 'https://book.douban.com/top250'
#獲取網(wǎng)頁(yè)
data = requests.get(url).text
#解析網(wǎng)頁(yè)
s = etree.HTML(data)
#獲取xpath   瀏覽其中的xpath不是完全可靠的   我們要將多余tbody刪掉
file= s.xpath('//*[@id="content"]/div/div[1]/div/table//tr/td[2]/div[1]/a/@title')
score= s.xpath('//*[@id="content"]/div/div[1]/div/table/tr/td[2]/div[2]/span[2]/text()')  #score 評(píng)分

   

#我們需要循環(huán)進(jìn)名字依次打印出來(lái)
for i in range(25):
    print("{},{}".format(file[i],score[i]))

for i in range ()作用:

range ()函數(shù)的使用是這樣的:
range(3)即:從1到3,不包含3,即0,1,2
range(1,3)即:從1到3,不包含3,即1,2
range(1,3,2)即:1,2。第三個(gè)數(shù)字2是代表步長(zhǎng)。如果不設(shè)置,就是默認(rèn)步長(zhǎng)為1
注:如果range()里面的數(shù)剛好,和我們爬取的數(shù)據(jù)個(gè)數(shù)一樣,編譯器不會(huì)報(bào)錯(cuò)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容