Python爬蟲(chóng)小實(shí)例

爬蟲(chóng)糗事百科第一頁(yè)的段子

import requests

import re

def comenzar():

? ? ? ?r = requests.get('https://www.qiushibaike.com')pattern = '*?<.*?class="content">.*?(.*?).*?'

? ? ? ?result = re.findall(pattern,r.text,re.S)

? ? ? ?#對(duì)內(nèi)容進(jìn)行過(guò)濾

? ? ? ? num = 1

? ? ? ? for subRequest in result:

? ? ? ? ? ? ? ?filterResult = re.sub('|&quat','',subRequest)print(str(num) + '.' + filterResult + '\n')

? ? ? ? ? ? ? ?with open('糗事.txt','a',encoding = 'utf-8') as f:

? ? ? ? ? ? ? ? f.write(str(num) + '.' + filterResult + '\n\n\n')

? ? ? ? ? ? ? ? num += 1

comenzar()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • (本文源于轉(zhuǎn)載或摘抄整理)手把手教你用Python爬蟲(chóng)煎蛋妹紙海量圖片豈安科技[圖片上傳中。。。(1)] 我們的目...
    JackyTsuuuy閱讀 1,528評(píng)論 1 5
  • re模塊手冊(cè) 本模塊提供了和Perl里的正則表達(dá)式類似的功能,不關(guān)是正則表達(dá)式本身還是被搜索的字符串,都可以...
    喜歡吃栗子閱讀 4,211評(píng)論 0 13
  • 背景 一年多以前我在知乎上答了有關(guān)LeetCode的問(wèn)題, 分享了一些自己做題目的經(jīng)驗(yàn)。 張土汪:刷leetcod...
    土汪閱讀 12,929評(píng)論 0 33
  • 于是就跟老師申請(qǐng),小乖那么萌讓她做對(duì)照組吧! 沒(méi)錯(cuò)長(zhǎng)得萌就是有理??!
    醫(yī)小喵閱讀 148評(píng)論 3 5
  • 我們的一生,免不了成功,免不了失敗。更免不了后悔,因?yàn)檫@些內(nèi)容,我們的經(jīng)歷和感悟都變得精彩和深刻。 有時(shí)候,當(dāng)我們...
    落水有聲閱讀 488評(píng)論 1 2

友情鏈接更多精彩內(nèi)容