正則表達式

感悟:?可選,|的優(yōu)先級比較小,使用的時候加(),一個單詞可選可以用(test)?
1、元字符介紹

"^" :^會匹配行或者字符串的起始位置,有時還會匹配整個文檔的起始位置。

"$" :$會匹配行或字符串的結(jié)尾

"\b" :不會消耗任何字符只匹配一個位置,常用于匹配單詞邊界 如 我想從字符串中"This is Regex"匹配單獨的單詞 "is" 正則就要寫成 "\bis\b"

\b 不會匹配is 兩邊的字符,但它會識別is 兩邊是否為單詞的邊界

"\d": 匹配數(shù)字,

例如要匹配一個固定格式的電話號碼以0開頭前4位后7位,如0737-5686123 正則:^0\d\d\d-\d\d\d\d\d\d\d$ 這里只是為了介紹"\d"字符,實際上有更好的寫法會在 下面介紹。

"\w":匹配字母,數(shù)字,下劃線.

例如我要匹配"a2345BCD__TTz" 正則:"\w+" 這里的"+"字符為一個量詞指重復的次數(shù),稍后會詳細介紹。

"\s":匹配空格

例如字符 "a b c" 正則:"\w\s\w\s\w" 一個字符后跟一個空格,如有字符間有多個空格直接把"\s" 寫成 "\s+" 讓空格重復

".":匹配除了換行符以外的任何字符

這個算是"\w"的加強版了"\w"不能匹配 空格 如果把字符串加上空格用"\w"就受限了,看下用 "."是如何匹配字符"a23 4 5 B C D__TTz" 正則:".+"

"[abc]": 字符組 匹配包含括號內(nèi)元素的字符

    這個比較簡單了只匹配括號內(nèi)存在的字符,還可以寫成[a-z]匹配a至z的所以字母就等于可以用來控制只能輸入英文了。

2、幾種反義
  寫法很簡單改成大寫就行了,意思與原來的相反。

"\W" 匹配任意不是字母,數(shù)字,下劃線 的字符

"\S" 匹配任意不是空白符的字符

"\D" 匹配任意非數(shù)字的字符

"\B" 匹配不是單詞開頭或結(jié)束的位置

"[^abc]" 匹配除了abc以外的任意字符

3、量詞
先解釋關于量詞所涉及到的重要的三個概念

貪婪(貪心) 如"*"字符 貪婪量詞會首先匹配整個字符串,嘗試匹配時,它會選定盡可能多的內(nèi)容,如果 失敗則回退一個字符,然后再次嘗試回退的過程就叫做回溯,它會每次回退一個字符,直到找到匹配的內(nèi)容或者沒有字符可以回退。相比下面兩種貪婪量詞對資源的消耗是最大的,

懶惰(勉強) 如 "?" 懶惰量詞使用另一種方式匹配,它從目標的起始位置開始嘗試匹配,每次檢查一個字符,并尋找它要匹配的內(nèi)容,如此循環(huán)直到字符結(jié)尾處。

占有 如"+" 占有量詞會覆蓋事個目標字符串,然后嘗試尋找匹配內(nèi)容 ,但它只嘗試一次,不會回溯,就好比先抓一把石頭,然后從石頭中挑出黃金

"*"(貪婪) 重復零次或更多

例如"aaaaaaaa" 匹配字符串中所有的a 正則: "a*" 會出到所有的字符"a"

 "+"(懶惰)   重復一次或更多次

例如"aaaaaaaa" 匹配字符串中所有的a 正則: "a+" 會取到字符中所有的a字符, "a+"與"a"不同在于"+"至少是一次而"" 可以是0次,

稍后會與"?"字符結(jié)合來體現(xiàn)這種區(qū)別

 "?"(占有)   重復零次或一次

例如"aaaaaaaa" 匹配字符串中的a 正則 : "a?" 只會匹配一次,也就是結(jié)果只是單個字符a

"{n}" 重復n次

例如從"aaaaaaaa" 匹配字符串的a 并重復3次 正則: "a{3}" 結(jié)果就是取到3個a字符 "aaa";

"{n,m}" 重復n到m次

例如正則 "a{3,4}" 將a重復匹配3次或者4次 所以供匹配的字符可以是三個"aaa"也可以是四個"aaaa" 正則都可以匹配到

 "{n,}"  重復n次或更多次

與{n,m}不同之處就在于匹配的次數(shù)將沒有上限,但至少要重復n次 如 正則"a{3,}" a至少要重復3次

把量詞了解了之后之前匹配電話號碼的正則現(xiàn)在就可以改得簡單點了^0\d\d\d-\d\d\d\d\d\d\d$ 可以改為"^0\d+-\d{7}$"。

這樣寫還不夠完美如果因為前面的區(qū)號沒有做限定,以至于可以輸入很多們,而通常只能是3位或者4位,

現(xiàn)在再改一下 "^0\d{2,3}-\d{7}"如此一來區(qū)號部分就可以匹配3位或者4位的了
4、正則進階
  先了解在正則中捕獲分組的概念,其實就是一個括號內(nèi)的內(nèi)容 如 "(\d)\d" 而"(\d)" 這就是一個捕獲分組,可以對捕獲分組進行 后向引用 (如果后而有相同的內(nèi)容則可以直接引用前面定義的捕獲組,以簡化表達式) 如(\d)\d\1 這里的"\1"就是對"(\d)"的后向引用

那捕獲分組有什么用呢看個例子就知道了

如 "zery zery" 正則 \b(\w+)\b\s\1\b 所以這里的"\1"所捕獲到的字符也是 與(\w+)一樣的"zery",為了讓組名更有意義,組名是可以自定義名字的

"\b(?<name>\w+)\b\s\k<name>\b" 用"?<name>"就可以自定義組名了而要后向引用組時要記得寫成 "\k<name>";自定義組名后,捕獲組中匹配到的值就會保存在定義的組名里

下面列出捕獲分組常有的用法

"(exp)" 匹配exp,并捕獲文本到自動命名的組里

"(?<name>exp)" 匹配exp,并捕獲文本到名稱為name的組里

"(?:exp)" 匹配exp,不捕獲匹配的文本,也不給此分組分配組號

以下為零寬斷言

"(?=exp)" 匹配exp前面的位置

如 "How are you doing" 正則"(?<txt>.+(?=ing))" 這里取ing前所有的字符,并定義了一個捕獲分組名字為 "txt" 而"txt"這個組里的值為"How are you do";

"(?<=exp)" 匹配exp后面的位置

如 "How are you doing" 正則"(?<txt>(?<=How).+)" 這里取"How"之后所有的字符,并定義了一個捕獲分組名字為 "txt" 而"txt"這個組里的值為" are you doing";

"(?!exp)" 匹配后面跟的不是exp的位置

如 "123abc" 正則 "\d{3}(?!\d)"匹配3位數(shù)字后非數(shù)字的結(jié)果

"(?<!exp)" 匹配前面不是exp的位置

如 "abc123 " 正則 "(?<![0-9])123" 匹配"123"前面是非數(shù)字的結(jié)果也可寫成"(?!<\d)123"

https://www.cnblogs.com/ioshe/p/5482168.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容