曰韩无码中心,一二三区影院,欧美裸体视频

爬蟲基礎系列BeautifulSoup——搜索文檔樹(3)

8586231_192932724000_2.jpg

find_all方法返回的是BeautifulSoup特有的結果集，里面裝的是標簽對象

from bs4 import BeautifulSoup
import re
html = """
<html><head><title>The Dormouse's story</title><title>The Dormouse's story2</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a  class="sister" id="link1"><!-- Elsie --></a>,
<a  class="sister" id="link2">Lacie</a> and
<a  class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
#解析字符串形式的html
soup=BeautifulSoup(html,'lxml')

①

data=soup.find_all('a')
print(type(data))

結果：

<class 'bs4.element.ResultSet'>

取值方法：

data=soup.find_all('a')
for i in data:
    print(i.string)

結果：

 Elsie 
Lacie
Tillie

②

#根據正則表達式查找標簽
data1=soup.find_all(re.compile('^b'))
for i in data1:
    print(data1)

返回結果為所有以b開頭的所有標簽
③

#根據屬性查找標簽
data2=soup.find_all(id='link2')
for i in data2:
    print(data2)

結果：

[<a class="sister"  id="link2">Lacie</a>]

④

#根據標簽內容獲取標簽內容
data3=soup.find_all(text='Tillie')
data4=soup.find_all(text=['Lacie','Tillie'])
data5=soup.find_all(text=re.compile("Do"))
print(data5)

結果：data3，data4，data5

['Tillie']
['Lacie', 'Tillie']
["The Dormouse's story", "The Dormouse's story2", "The Dormouse's story"]

最后編輯于：2019.05.19 06:34:13

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成，瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發(fā)布，文章內容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

爬蟲基礎系列BeautifulSoup——搜索文檔樹(3)

爬蟲基礎系列BeautifulSoup——搜索文檔樹(3)

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

爬蟲基礎系列BeautifulSoup——搜索文檔樹(3)

友情鏈接更多精彩內容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av