python 爬蟲學習1

注意格式!格式!格式!

from bs4 import BeautifulSoup
import requests

def detailOper(url):
    web_data = requests.get(url)
    soup = BeautifulSoup(web_data.text, 'lxml')
    titles = soup.select('div.list > ul  > li > div > p.infoBox > a')
    prices = soup.select('div.list > ul  > li > div > p.priType-s > span > i')
    for title, price in zip(titles, prices):
        data = {
            'title': title.get_text(),
            'detailHerf': title.get('href'),
            'price': price.get_text().replace(u'萬', '').replace(' ', '')
        }
        print(data)

def start():
    urls = ['https://www.guazi.com/tj/buy/o{}/'.format(str(i)) for i in range(1, 30, 1)]
    for url in urls:
        detailOper(url)

if __name__ == '__main__':
    start()

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 爬蟲的架構是什么樣的呢?當我們想要設計一個我們適用于現實的爬蟲時,應該考慮到什么呢?接下來將會得到答案! 上圖...
    飛飛要加油啊閱讀 521評論 0 1
  • 近期網上掀起爬蟲熱潮,題主配置的python包為3.6.1,對深網網頁進行數據爬取,從本書中學習經歷記載在此.Py...
    語落心生閱讀 2,187評論 0 0
  • Python爬蟲學習1 1、簡單制作爬蟲小程序 爬取百度首頁源代碼: urllib是一個非常重要的一個模塊 ,可以...
    HeartGo閱讀 226評論 0 1
  • 虛擬環(huán)境的最大好處是可以把不同的開發(fā)環(huán)境進行分隔,一個環(huán)境安裝的內容不影響另一個環(huán)境的內容。 1、虛擬環(huán)境安裝 用...
    MingSha閱讀 588評論 0 0
  • 一 烏云滾滾,黃沙漫漫。 汽車狂人霸天虎環(huán)顧四周,但見重兵圍困,同伙殘骸滿地狼藉。他長嘯一聲,沖天而起,鉆入云層,...
    空中的梨子閱讀 566評論 11 5

友情鏈接更多精彩內容