色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<bdo id="mqika"><th id="mqika"></th></bdo>

<blockquote id="mqika"></blockquote>

登錄注冊寫文章

關(guān)于爬蟲選擇xpath的細節(jié)解析

關(guān)于爬蟲選擇xpath的細節(jié)解析

爬蟲的具體選擇根據(jù)需求情形的不同，總是容易被如何書寫復(fù)雜的標簽解析困擾，我也深感其疼，網(wǎng)上資料很零散瑣粹，較為空洞理論，所以領(lǐng)悟的一些小技巧，分享給大家。

基本知識點1

就豆瓣top250對電影名的爬取進行詳解吧

標簽結(jié)構(gòu)

核心代碼如下，我們對xpath表達式寫什么進行探討

for quote in response.xpath('//div[@class="item"]'):
        yield {"電影名": quote.xpath(??).extract()}

//div[@class="info"]/div/a/span[@class="title"]/text()

匹配了網(wǎng)頁中所有的div[@class="info"]，而這是打破了原有的循環(huán)。正確做法應(yīng)是去掉前面的“//”

div[@class="info"]//span/text()

在首路徑不用//后我們中途跳級路徑爬取發(fā)現(xiàn)可以找到經(jīng)篩選后的所有span元素內(nèi)容，說明中途允許跳級

div[@class="info"]//span[@class="title"][1]/text()

下面正常爬取，此時我們還可以通過將.extract()改為.extract()[1]或者.extract_first()來代替span[@class="title"][1]中[1]

span[@class="title"]/text()

此處嘗試跳級路徑，發(fā)現(xiàn)爬取不到

以上可小做總結(jié)

xpath路徑篩選之后再次篩選應(yīng)注意第二次篩選首路徑應(yīng)該是緊接著的不加//的路徑然后后面可以隨意，可以跳級

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

python爬蟲里信息提取的核心方法: Beautifulsoup Xpath 正則表達式
20170531 這幾天重新拾起了爬蟲，算起來有將近5個月不碰python爬蟲了。對照著網(wǎng)上的程序和自己以前寫的...
八神蒼月閱讀 14,380評論 3贊 44
爬蟲課程（八）｜豆瓣：十分鐘學會使用XPath選擇器提取需要的元素值
前面我們在寫爬取豆瓣讀書內(nèi)容示例中提到了XPath，本文就詳細介紹下在爬蟲中如何使用XPath選擇器，掌握本文中的...
小怪聊職場閱讀 8,257評論 2贊 30

Spring Cloud
Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具（例如配置管理，服務(wù)發(fā)現(xiàn)，斷路器，智...
卡卡羅2017閱讀 136,604評論 19贊 139
用23行代碼爬取豆瓣音樂top250
網(wǎng)上有各種爬取豆瓣電影top250的教程，雖然豆瓣音樂top250和豆瓣電影top250的爬取十分類似，但是我大致...
愛吃西瓜的番茄醬閱讀 3,068評論 1贊 3
第三組+許士衛(wèi)+自我介紹
大家好，我是來自集團設(shè)備保障部的許士衛(wèi)。籍貫濟南，無很突出的愛好，但是都能參與。就像巨蟹座說的那樣，做事會一直堅持...
衛(wèi)偉閱讀 172評論 0贊 0

友情鏈接更多精彩內(nèi)容

2贊3贊

贊賞

手機看全文

琼中| 漠河县| 抚松县| 长宁区| 大姚县| 杂多县| 桐城市| 天津市| 北宁市| 兴安盟| 吴堡县| 龙泉市| 赤壁市| 原平市| 兴业县| 丹江口市| 甘孜县| 翁牛特旗| 巩义市| 鄯善县| 定西市| 科技| 两当县| 北海市| 汕尾市| 绿春县| 保康县| 元氏县| 丹棱县| 罗山县| 门源| 长乐市| 城步| 新昌县| 康乐县| 鹿泉市| 青铜峡市| 松桃| 巴彦淖尔市| 兴隆县| 黄龙县|

<s id="ee2qe"></s>