代碼:
#coding-utf8
#導(dǎo)入模塊
import requests
from lxml import etree
#網(wǎng)站
url = 'https://book.douban.com/top250'
#獲取網(wǎng)頁(yè)
data = requests.get(url).text
#解析網(wǎng)頁(yè)
s = etree.HTML(data)
#獲取xpath 瀏覽其中的xpath不是完全可靠的 我們要將多余tbody刪掉
file= s.xpath('//*[@id="content"]/div/div[1]/div/table//tr/td[2]/div[1]/a/@title')
score= s.xpath('//*[@id="content"]/div/div[1]/div/table/tr/td[2]/div[2]/span[2]/text()') #score 評(píng)分
#我們需要循環(huán)進(jìn)名字依次打印出來(lái)
for i in range(25):
print("{},{}".format(file[i],score[i]))
for i in range ()作用:
range ()函數(shù)的使用是這樣的:
range(3)即:從1到3,不包含3,即0,1,2
range(1,3)即:從1到3,不包含3,即1,2
range(1,3,2)即:1,2。第三個(gè)數(shù)字2是代表步長(zhǎng)。如果不設(shè)置,就是默認(rèn)步長(zhǎng)為1
注:如果range()里面的數(shù)剛好,和我們爬取的數(shù)據(jù)個(gè)數(shù)一樣,編譯器不會(huì)報(bào)錯(cuò)。