1.find_all(name, attrs, recursive, text, **kwargs)
name 參數(shù):可以查找所有名字為 name 的tag,字符串對象會被自動忽略掉,
findall()可以傳字符串,正則表達式,列表
2.CSS選擇器
在這里我們也可以利用類似的方法來篩選元素,用到的方法是soup.select(),返回類型是list
通過標簽名查找、通過類名查找、通過 id 名查找、并集查找、
屬性查找:查找時還可以加入屬性元素,屬性需要用中括號括起來,注意屬性和標簽屬于同一節(jié)點,所以中間不能加空格,否則會無法匹配到。
獲取內(nèi)容:以上的 select 方法返回的結果都是列表形式,可以遍歷形式輸出,然后用 get_text() 方法來獲取它的內(nèi)容。