個人學(xué)習(xí)筆記,方便自己查閱,僅供參考,歡迎交流
解析庫-Beautiful Soup
解析工具 Beautiful Soup,它借助網(wǎng)頁的結(jié)構(gòu)和屬性等特性來解析網(wǎng)頁。有了它 ,我們不用去寫一些復(fù)雜的正則表達式,只需要簡單的幾條語句,就可以完成網(wǎng)頁中某個元素的提取。
1.概述
Beautiful Soup 是Python的一個HTML或XML的解析庫,可以用它來方便地從網(wǎng)頁中提取數(shù)據(jù)。
頁中提取數(shù)據(jù)
2.解析器
3.基本用法
4.節(jié)點選擇器
- 選擇元素
- 提取信息
- 嵌套選擇
- 關(guān)聯(lián)選擇
5.方法選擇器
- find_all()
- find()
7.CSS選擇器
- 嵌套選擇
- 獲取屬性
- 獲取文本