【原創(chuàng)】Beautifulsoup如何只提取標(biāo)簽內(nèi)的文本

示例

如下代碼,只提取div里的文本,不提取span里的文本


from bs4 import BeautifulSoup

s='''
<div>
<span> 添加時間:</span>
" 26分鐘前"
<br>
<span> 作者:</span>
" 陳冠希"
<br>
</div>
'''

soup=BeautifulSoup(s,'html5lib')
div=soup.find('div')
print([text.strip() for text in div.find_all(text=True) if text.parent.name !='span' and text.strip()])

輸出結(jié)果

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 簡介網(wǎng)絡(luò)瀏覽器很可能是使用最廣的軟件。在這篇入門文章中,我將會介紹它們的幕后工作原理。我們會了解到,從您在地址欄輸...
    wengjq閱讀 2,319評論 2 15
  • ??DOM(文檔對象模型)是針對 HTML 和 XML 文檔的一個 API(應(yīng)用程序編程接口)。 ??DOM 描繪...
    霜天曉閱讀 3,869評論 0 7
  • 爺爺 昨天考試了,考的十分慌亂。前天晚上也沒睡好,所以昨天晚上特別困,一閉眼就睡著了,昨天沒有跟你聊天你想我...
    Chen豆豆閱讀 104評論 0 0
  • 就在剛才接水喝的時候,突然想起了有的人的淡 —— 不知道到底喜歡吃哪些東西,但感覺著,應(yīng)該會是...
    卜蝶閱讀 381評論 0 4
  • 爸爸: 寶貝來,給我抱一下~ 寶貝:不要,我要給你賣去“你好”那邊,叫老板給你弄漂亮點(diǎn),你太丑了 爸爸:把我賣掉你...
    嶼西在成長閱讀 83評論 0 0

友情鏈接更多精彩內(nèi)容