Python學(xué)習(xí)路線:定義實(shí)現(xiàn)最短匹配的正則表達(dá)式
在這里插入圖片描述
1、需求
我們正在嘗試用正則表達(dá)式對(duì)文本模式做匹配,但識(shí)別出來的是最長(zhǎng)的可能匹配。相反,我們想將其修改為最短的可能匹配。
2、解決方案
這個(gè)問題通常會(huì)在匹配的文本被一對(duì)開始和結(jié)束的分隔符包起來的時(shí)候出現(xiàn)(例如帶引號(hào)的字符串),為了說明這個(gè)問題,請(qǐng)看下面實(shí)例:
import re
str_pat=re.compile(r'\"(.*)\"')
text1='mark say "love"'
text2='mark say "love",jingjing say "yes"'
print(str_pat.findall(text1))
print(str_pat.findall(text2))
結(jié)果
['love']
['love",jingjing say "yes']
在這個(gè)例子中,模式r’"(.)"'嘗試去匹配包含在引號(hào)中的文本。但是,操作符在正則表達(dá)式中采用的是貪心策略,所以匹配過程是基于找出最長(zhǎng)的可能匹配來進(jìn)行的。所以上面才會(huì)出現(xiàn)【love",jingjing say "yes】這個(gè)匹配結(jié)果。
要解決這個(gè)問題,只要在模式中的*操作符后面加上?修飾符就可以了。
示例:
import re
str_pat=re.compile(r'\"(.*?)\"')
text1='mark say "love"'
text2='mark say "love",jingjing say "yes"'
print(str_pat.findall(text1))
print(str_pat.findall(text2))
如果你依然在編程的世界里迷茫,
不知道自己的未來規(guī)劃,
對(duì)python感興趣,
這里推薦一下我的學(xué)習(xí)交流圈QQ群:895 797 751,
里面都是學(xué)習(xí)python的,
結(jié)果:
['love']
['love', 'yes']
這么做使得匹配過程不會(huì)以貪心方式進(jìn)行,也就會(huì)產(chǎn)生最短的匹配了。
3、分析
本節(jié)提到了一個(gè)當(dāng)編寫還有句點(diǎn)【.】字符的正則表達(dá)式常會(huì)遇到的問題。為了解決最長(zhǎng)匹配問題,讓匹配變?yōu)樽疃唐ヅ?,需要?或+后加上一個(gè)【?】。
后面的Python學(xué)習(xí)路線在下期為大家更新!