import requests
from bs4 import BeautifulSoup
#引入BS庫
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
html = res.text
soup = BeautifulSoup(html,'html.parser') #把網(wǎng)頁解析為BeautifulSoup對象
# print(res.text) # 獲取到的html文本
# print(soup) # 獲取到的html文本
# print(type(soup)) # soup為<class 'bs4.BeautifulSoup'>對象,非字符串
items = soup.find_all(class_='books') # 通過匹配標簽和屬性提取我們想要的數(shù)據(jù)
# print(items[0]) # 打印items
# print(len(items)) # 打印items
# print(type(items)) # items的數(shù)據(jù)類型<class 'bs4.element.ResultSet'>
Tag_title = items[0].find(class_='title')
print(Tag_title)
print(Tag_title['href'])
# print(str(items[0])+'__________________')
2019-05-04
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
相關閱讀更多精彩內(nèi)容
- 兩年前的上海灘,初來乍到的它居然敢稱王??! “有句俗話說得好,酒香不怕巷子深嘛!”名城煲王的創(chuàng)始人Alan爽朗的笑...