亚洲图色9p,可乐小明操操操

BeautifulSoup中可以通過name和attrs去定位名稱和屬性，以找到特定的html代碼。更值得稱贊的是，attrs支持正則表達(dá)式。

如：

<div class="cool">
    <h1 class="abc">design</h1>
</div>

搜索此行，可以這樣寫

abcSoup = soup.find(name="h1", attrs={"class":"abc"})

但如果情況變成

<div class="cool">
    <h1 class="abc">design</h1>
    <h1 class="abc test1">design photo</h1>
    <h1 class="abc test2">design product</h1>
</div>

此時(shí)，想一次性找到三個(gè)h1，就需要用到正則了。

abcSouplist = soup.find_all(name="h1", attrs={"class":re.compile(r"abc(\s\w+)?")})

便可以找到：

<h1 class="abc">design</h1>
<h1 class="abc test1">design photo</h1>
<h1 class="abc test2">design product</h1>

還有一種情況，就是判斷一種屬性是否存在，從而找到該文件?？梢酝ㄟ^True和Flase進(jìn)行篩選。

比如：

<div class="cool">
    <h1 class="abc" id="test">design</h1>
    <h1 class="abc test1">design photo</h1>
    <h1 class="abc test2">design product</h1>
</div>

想選擇所有不存在id屬性的文件，可以寫如下表達(dá)式篩選。

Soup.find_all("h1",attrs={"id":Flase})

就可以篩選出下面兩行h1啦??

<h1 class="abc test1">design photo</h1>
<h1 class="abc test2">design product</h1>

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Python爬蟲中BeautifulSoup正則表達(dá)式的使用

Python爬蟲中BeautifulSoup正則表達(dá)式的使用

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Python爬蟲中BeautifulSoup正則表達(dá)式的使用

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av