BeautifulSoup 庫的使用

用于解析、遍歷、維護“標(biāo)簽樹”的庫
用于解析html
from bs4 import BeautifulSoup
import request
r=requests.get("http://www.baidu.com")
demo=r.text #返回的是一個html的文件
soup=BeautifulSoup(demo,'html.parser') #解析html信息

另外一種方式 soup=BeautifulSoup(open('D://demo.html'),'html.parser'))

tag=soup.a #找到a標(biāo)簽
print(tag.attrs['class']) #查看a標(biāo)簽的屬性信息
print(tag.string)

用這個網(wǎng)址測試:https://python123.io/ws/demo.html

soup.title

soup.a.parent.name

soup.p.parent.name

image.png
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 導(dǎo)入所需包 from bs4 import BeautifulSoup soup = BeautifulSoup...
    野狗子嗷嗷嗷閱讀 4,250評論 0 0
  • Beautiful Soup是一個可以從HTML或XML文件中提取數(shù)據(jù)的Python庫.它能夠通過你喜歡的轉(zhuǎn)換器實...
    LitOrange閱讀 5,420評論 0 4
  • 對象的種類BeautifulSoup會將HTML文檔抓換成一個樹形結(jié)構(gòu), 每個節(jié)點都是Python對象,所有對象可...
    寒劍飄零閱讀 639評論 0 1
  • 關(guān)于bs4,官方文檔的介紹已經(jīng)非常詳細了,傳送:Beautifulsoup 4官方文檔,這里我把它組織成自己已經(jīng)消...
    徐薇薇閱讀 5,957評論 0 1
  • 夢到我把竹筐向地上扔去 水嘩嘩地流出,魚,水草,鐮刀 以及云的影子 各自不慌不忙地向竹籃外 游,長,切割以及飄動時...
    李榆閱讀 507評論 16 14

友情鏈接更多精彩內(nèi)容