工具

BeautifulSoup使用

from bs4 import BeautifulSoup
html_simple = '\
<html>\
<body>\
<h1 id="title">Hello World</h1>\
<a hred="#" class="link">This is link1</a>\
<a hred="#link2" class="link">This is link2</a>\
</body>
</html>'

soup = BeautifulSoup(html_simple)
print(soup.text)

打印結(jié)果：

Hello WorldThis is link1This is link2

通過特定的標(biāo)簽取元素

select

soup = BeautifulSoup(html_simple)
header = soup.select("h1")
print(header)
print(header[0])
print(header[0].text)

alink = soup.select("a")
print(alink)
for link in alink:
    print(link)
    print(link.text)

結(jié)果：

[<h1 id="title">Hello World</h1>] //列表
<h1 id="title">Hello World</h1> //第一個元素
Hello World //文本
[<a class="link" hred="#">This is link1</a>, <a class="link" hred="#link2">This is link2</a>]
<a class="link" href="#">This is link1</a>
This is link1
<a class="link" href="#link2">This is link2</a>
This is link2

通過css屬性取元素

header = soup.select("#title") #id前面加上#
print(header)
print(header[0])
print(header[0].text)

alink = soup.select(".link")#class前面加上.
print(alink)
for link in alink:
    print(link)
    print(link.text)

結(jié)果：

[<h1 id="title">Hello World</h1>]
<h1 id="title">Hello World</h1>
Hello World
[<a class="link" href="#">This is link1</a>, <a class="link" href="#link2">This is link2</a>]
<a class="link" href="#">This is link1</a>
This is link1
<a class="link" href="#link2">This is link2</a>
This is link2

id、class區(qū)別
id 唯一標(biāo)識
class 重復(fù)標(biāo)識

取得標(biāo)簽中的鏈接

alink = soup.select(".link")#class前面加上.
print(alink)
for link in alink:
    print(link["href"])

結(jié)果：

#
#link2

屬性通過字典的形式存放，所以可以

ForeSpider爬蟲軟件

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

爬蟲入門

爬蟲入門

工具

BeautifulSoup使用

通過特定的標(biāo)簽取元素

通過css屬性取元素

取得標(biāo)簽中的鏈接

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

爬蟲入門

工具

BeautifulSoup使用

通過特定的標(biāo)簽取元素

通過css屬性取元素

取得標(biāo)簽中的鏈接

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av