爬取一頁商品數(shù)據(jù)

![要求.png](http://upload-images.jianshu.io/upload_images/1706760-631a431588d568f4.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

以下是實現(xiàn)的代碼



from bs4 import BeautifulSoup
import requests
'''
def get_list_links():
    num = input('page_num:')
    for i in range(1, int(num) + 1):
        list_urls = 'http://bj.58.com/pbdn/0/pn{}/'.format(i)
        list_htmls = requests.get(list_urls)
        list_soup = BeautifulSoup(list_htmls.text, 'lxml')
        # print(list_soup) 沒問題
        list_links = list_soup.select('td.t > a.t')
        # print(list_links) 沒問題
        for list_link in list_links:
            link = list_link.get('href').split('?')[0]
        return link
        detail_html = requests.get(link)
        detail_soup = BeautifulSoup(detail_html.text, 'lxml')
        title = detail_soup.select('div.col_sub h1')[0].get_text()
        print(title)
get_list_links()
'''

url = 'http://bj.58.com/pbdn/0/'
html = requests.get(url)
#print(html)
bsObj = BeautifulSoup(html.text, 'lxml')
#print(bsObj)
list_links = bsObj.select('td.t > a.t')
for list_link in list_links:
    print(list_link)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容