Beautiful Soup 搜索文檔樹

1.find_all(name, attrs, recursive, text, **kwargs)

name 參數(shù):可以查找所有名字為 name 的tag,字符串對象會被自動忽略掉,

findall()可以傳字符串,正則表達式,列表

2.CSS選擇器

在這里我們也可以利用類似的方法來篩選元素,用到的方法是soup.select(),返回類型是list

通過標簽名查找、通過類名查找、通過 id 名查找、并集查找、

屬性查找:查找時還可以加入屬性元素,屬性需要用中括號括起來,注意屬性和標簽屬于同一節(jié)點,所以中間不能加空格,否則會無法匹配到。

獲取內(nèi)容:以上的 select 方法返回的結果都是列表形式,可以遍歷形式輸出,然后用 get_text() 方法來獲取它的內(nèi)容。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容