正則表達(dá)式01

/W 匹配非特殊字符 即字母 數(shù)字下劃線
/d 匹配任意的十進(jìn)制數(shù)
/s 匹配任意空白字符

/W 大寫W,匹配小w相反的詞,即匹配: 特殊字符
/D 除了任意十進(jìn)制的

[ ] 原子組

. 匹配任意字符

^ 開始符

結(jié)束符

  • 匹配多次

? 匹配 0

  • 匹配1以上

T{ 3} 前面的原子T出現(xiàn)了3次

{n,}剛好出現(xiàn)n次

{n,m}至少出現(xiàn)n次,最多出現(xiàn)m次

| 或選擇符,1|2 ,即1或2

( ) 提取一個(gè)內(nèi)容上

作業(yè):

抓取一個(gè)漫畫網(wǎng)站的排行榜的漫畫名


image.png

網(wǎng)址:http://www.pufei.net/shaonianrexue/

打開源碼查看規(guī)律:


image.png
import re
import urllib.request


data = urllib.request.urlopen("http://www.pufei.net/shaonianrexue/").read()

#對(duì)讀取的結(jié)果進(jìn)行編碼
data= data.decode("gb2312")

#定義正則表達(dá)式
pat='class="vtip">(.*?)</a>'

#根據(jù)正則表達(dá)式,進(jìn)行匹配得到結(jié)果放入到result
result= re.compile(pat).findall(str(data))

#定義一個(gè)打開的文件
refile = open("/Users/vincentwen/Downloads/requestfile.txt","w")

#循環(huán)寫入內(nèi)容,并換行
for i in range(0,len(result)):
    refile.write(result[i]+"\n")

#關(guān)閉打開的文件
refile.close()



image.png

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容