from pyquery import PyQuery
html = '''
<head>
<title>hello</title>
</head>
'''
p = PyQuery(html)
-
html():獲取相應(yīng)的 HTML 塊
p('head').html()
>>> <title>hello</title>
p('head').text()
>>> 'hello'
根據(jù) HTML 標(biāo)簽來獲取元素
from pyquery import PyQuery
html = '''
<div>
<p>test 1</p>
<p>test 2</p>
</div>
'''
p = PyQuery(html)
# 獲取所有p標(biāo)簽
p('p')
>>> [<p>, <p>]
print(p('p'))
>>> <p>test 1</p>
<p>test 2</p>
# 獲取第一個p標(biāo)簽的內(nèi)容
p('p').eq(0).html()
>>> 'test 1'
# 獲取第二個p標(biāo)簽的內(nèi)容
p('p').eq(1).html()
>>> 'test 2'
# 不用 eq 方法默認(rèn)返回第一個
p('p').html()
>>> 'test 1'
根據(jù)類名、id 名得到指定元素
from pyquery import PyQuery
html = '''
<div>
<p id='1'>test 1</p>
<p class='abc'>test 2</p>
</div>
'''
p = PyQuery(html)
# 返回 id='1' 的p標(biāo)簽內(nèi)容
p('p').filter('#1').html()
>>> 'test 1'
# 返回 class='abc' 的p標(biāo)簽內(nèi)容
p('p').filter('.abc').html()
>>> 'test 2'
查找嵌套元素
from pyquery import PyQuery
html = '''
<div>
<p id='1'>test 1</p>
<p class='abc'>test 2</p>
</div>
'''
p = PyQuery(html)
# 查找div下的p標(biāo)簽
>>> p('div').find('p')
[<p#1>, <p.abc>]
# 返回div下的第一個p標(biāo)簽內(nèi)容
p('div').find('p').eq(0).html()
>>> 'test 1'
根據(jù)類名、id 名獲取元素
from pyquery import PyQuery
html = '''
<div>
<p id='1'>test 1</p>
<p class='abc'>test 2</p>
</div>
'''
p = PyQuery(html)
# 根據(jù)id名獲取元素
p('#1').html()
>>> 'test 1'
# 根據(jù)class名獲取元素
>>> p('.abc').html()
'test 2'
獲取屬性值
from pyquery import PyQuery
html = '''
<p id='my_id'>
<a >hello</a>
</p>
'''
p = PyQuery(html)
# 獲取a標(biāo)簽的href屬性
p('a').attr('href')
>>> 'http://hello.com'
獲取子元素
from pyquery import PyQuery
html = '''
<span>
<p id='1'>hello</p>
<p id='2'>world</p>
</span>
'''
p = PyQuery(html)
# 提取div的所有子元素
p.children()
>>> [<p#1>, <p#2>]
# 提取div下id=‘1’的子元素
p.children('#1')
>>> [<p#1>]
獲取父元素
from pyquery import PyQuery
html = '''
<span>
<p id='1'>hello</p>
<p id='2'>world</p>
</span>
'''
p = PyQuery(html)
# 提取p標(biāo)簽的父元素
p('p').parents()
>>> [<span>]
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。