正則表達式小記錄

正則表達式小記錄

正則表達式其實就是在執(zhí)行搜索時的格式,從左到右進行匹配。

一般來說,正則表達式是大小寫敏感的。

1. 元字符

正則表達式主要依賴于元字符. 元字符不代表他們本身的字面意思, 他們都有特殊的含義.

元字符 描述
. 句號匹配任意單個字符除了換行符.
[ ] 字符種類. 匹配方括號內(nèi)的任意字符.不關心順序.
[^ ] 否定的字符種類. 匹配除了方括號里的任意字符
* 匹配>=0個重復的在之前*的字符.
+ 匹配>=1個重復的+號的字符.
? 標記?之前的字符為可選.
{n,m} 匹配num個大括號之前的字符 (n <= num <= m).
(xyz) 字符集, 匹配與 xyz 完全相等的字符串.
| 或運算符,匹配符號前或后的字符.
\ 轉(zhuǎn)義字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \ `
^ 開始行開始匹配.
$ 末端開始匹配.

1.1點運算符 .

例如, 表達式.ar匹配一個任意字符后面跟著是ar的字符串.

1.2字符集

例如, 表達式[Tt]he 匹配 theThe.

方括號的句號就表示句號. 表達式 ar[.] 匹配 ar.字符串

例如, 表達式[^c]ar匹配一個后面跟著ar的除了c的任意字符.

1.3重復次數(shù)

. 例如, 表達式 a* 匹配以0或更多個a開頭的字符, 因為有0個這個條件, 其實也就匹配了所有的字符.

表達式[a-z]* 匹配一個行中所有以小寫字母開頭的字符串.

*字符和.字符搭配可以匹配所有的字符.*.

*和表示匹配空格的符號\s連起來用, 如表達式\s*cat\s*匹配0或更多個空格開頭和0或更多個空格結(jié)尾的cat字符串.

例如表達式c.+t 匹配以首字母c開頭以t結(jié)尾,中間跟著任意個字符的字符串.

例如, 表達式 [T]?he 匹配字符串 heThe.

1.4{}

例如, 表達式 [0-9]{2,3} 匹配最少 2 位最多 3 位 0~9 的數(shù)字.

例如, [0-9]{2,} 匹配至少兩位 0~9 的數(shù)字.

例如, [0-9]{3} 匹配3位數(shù)字

1.5(...) 特征標群

例如, 表達式 (ab)* 匹配連續(xù)出現(xiàn) 0 或更多個 ab.

我們還可以在 () 中用或字符 | 表示或. 例如, (c|g|p)ar 匹配 cargarpar.

1.6| 或運算符

例如 (T|t)he|car 匹配 (T|t)hecar.

1.7轉(zhuǎn)碼特殊字符

例如 . 是用來匹配除換行符外的所有字符的. 如果想要匹配句子中的 . 則要寫成 \. 以下這個例子 \.?是選擇性匹配.

1.8錨點

例如, 在 abc 中使用表達式 ^a 會得到結(jié)果 a. 但如果使用 ^b 將匹配不到任何結(jié)果. 因為在字符串 abc 中并不是以 b開頭.

例如, ^(T|t)he 匹配以 Thethe 開頭的字符串.

例如, (at\.)$ 匹配以 at. 結(jié)尾的字符串.

2.簡寫字符集

正則表達式提供一些常用的字符集簡寫. 如下:

簡寫 描述
. 除換行符外的所有字符
\w 匹配所有字母數(shù)字, 等同于 [a-zA-Z0-9_]
\W 匹配所有非字母數(shù)字, 即符號, 等同于: [^\w]
\d 匹配數(shù)字: [0-9]
\D 匹配非數(shù)字: [^\d]
\s 匹配所有空格字符, 等同于: [\t\n\f\r\p{Z}]
\S 匹配所有非空格字符: [^\s]
\f 匹配一個換頁符
\n 匹配一個換行符
\r 匹配一個回車符
\t 匹配一個制表符
\v 匹配一個垂直制表符
\p 匹配 CR/LF (等同于 \r\n),用來匹配 DOS 行終止符

3.零寬度斷言(前后預查)

先行斷言用于判斷所匹配的格式是否在另一個確定的格式之前, 匹配結(jié)果不包含該確定格式(僅作為約束).

例如, 我們想要獲得所有跟在 $ 符號后的數(shù)字, 我們可以使用正后發(fā)斷言 (?<=\$)[0-9\.]*. 這個表達式匹配 $ 開頭, 之后跟著 0,1,2,3,4,5,6,7,8,9,. 這些字符可以出現(xiàn)大于等于 0 次.

符號 描述
?= 行斷言-存在
?! 行斷言-排除
?<= 發(fā)斷言-存在
?<! 發(fā)斷言-排除

例如, 表達式 (T|t)he(?=\sfat) 匹配 Thethe, 在括號中我們又定義了正先行斷言 (?=\sfat) ,即 Thethe 后面緊跟著 (空格)fat.

表達式 (T|t)he(?!\sfat) 匹配 Thethe, 且其后不跟著 (空格)fat.

例如, 表達式 (?<=(T|t)he\s)(fat|mat) 匹配 fatmat, 且其前跟著 Thethe.

例如, 表達式 (?<!(T|t)he\s)(cat) 匹配 cat, 且其前不跟著 Thethe.

4.標志

標志也叫模式修正符, 因為它可以用來修改表達式的搜索結(jié)果. 這些標志可以任意的組合使用, 它也是整個正則表達式的一部分.

標志 描述
i 忽略大小寫.
g 全局搜索.即(不僅僅返回第一個匹配的, 而是返回全部)
m 多行的: 錨點元字符 ^ $ 工作范圍在每行的起始.

例如, 表達式 /The/gi 表示在全局搜索 The, 在后面的 i 將其條件修改為忽略大小寫, 則變成搜索 theThe, g 表示全局搜索.

例如, 表達式 /.(at)/g 表示搜索 任意字符(除了換行) + at, 并返回全部結(jié)果.

例如, 表達式 /at(.)?$/gm 表示小寫字符 a 后跟小寫字符 t , 末尾可選除換行符外任意字符. 根據(jù) m 修飾符, 現(xiàn)在表達式匹配每行的結(jié)尾.

5.貪婪匹配與惰性匹配 (Greedy vs lazy matching)

正則表達式默認采用貪婪匹配模式,在該模式下意味著會匹配盡可能長的子串。我們可以使用 ? 將貪婪匹配模式轉(zhuǎn)化為惰性匹配模式。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • [TOC] 什么是正則表達式? 正則表達式是一組由字母和符號組成的特殊文本, 它可以用來從文本中找出滿足你想要的格...
    Selen_Lin閱讀 623評論 0 0
  • 什么是正則表達式? 正則表達式是一組由字母和符號組成的特殊文本, 它可以用來從文本中找出滿足你想要的格式的句子. ...
    l_genius閱讀 676評論 0 0
  • 寫在最前面的話 最近在瀏覽Github Star榜時發(fā)現(xiàn)了關于學習正則表達式的介紹,感覺非常不錯,可以邊看邊學邊練...
    王詩翔閱讀 2,690評論 1 21
  • Python中的正則表達式(re) import rere.match #從開始位置開始匹配,如果開頭沒有則無re...
    BigJeffWang閱讀 7,577評論 0 99
  • iOS中使用正則表達式就不得不提NSRegularExpression,所以我們需要先搞清楚什么是NSRegula...
    sunmumu1222閱讀 2,478評論 0 4

友情鏈接更多精彩內(nèi)容