正則表達(dá)式

正則表達(dá)式

1.調(diào)用模式

import re
pattern = re,compile(r'',re.S)
result = re.findall(pattern,text)
#查找全部
result = re.find()
#????????????????
result = re.match()
#匹配否和條件的第一個(gè)

2.匹配模式

1. re.match(pattern,text)
#嘗試從字符串的開(kāi)始開(kāi)始匹配
2. re.search(pattern,html)
#在字符串內(nèi)查找模式匹配,只找到第一個(gè)匹配然后返回
‘’‘
    re.match只匹配字符串的開(kāi)始,如果字符串開(kāi)始不符合正則表達(dá)式,則匹配失敗,函數(shù)返回None;而re.search匹配整個(gè)字符串,直到找到一個(gè)匹配。
’‘’
3. re.sub(pattern,reply,text,count)
#用string替換reply,count為替換個(gè)數(shù)
#用于替換字符串中的匹配項(xiàng)
4. re.spilt(r'\s+',text')
#分割字符串;按空格分割
5.re.findall(pattern,text)
#
6.re.compile(r'',re.S)
#

小測(cè)試:

url = 'http://www.mzitu.com/'
    headers = {
        'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}

    html = requests.get(url,headers=headers).text
    #print(html)
    pattern = re.compile(r'<a href="(.*?)".*?>(.*?)</a>',re.S)
    results = re.findall(pattern,html)
    #print(results)
    for result in results:
        print(result)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容