婷婷国产成人精品小说,二级久久久,蜜桃AV永久网站

本文旨在用最通俗的語(yǔ)言講述最枯燥的基本知識(shí)。

文章提綱：

1、元字符

2、重復(fù)限定符

3、分組

4、轉(zhuǎn)義

5、條件或

6、區(qū)間

7、零寬斷言

8、捕獲和非捕獲

9、反向引用

10、貪婪和非貪婪

11、反義

正則表達(dá)式在幾乎所有語(yǔ)言中都可以使用，無(wú)論是前端的 JavaScript、還是后端的 Java、c#。他們都提供相應(yīng)的接口 / 函數(shù)支持正則表達(dá)式。

但很神奇的是：無(wú)論你大學(xué)選擇哪一門(mén)計(jì)算機(jī)語(yǔ)言，都沒(méi)有關(guān)于正則表達(dá)式的課程給你修，在你學(xué)會(huì)正則之前，你只能看著那些正則大師們，寫(xiě)了一串外星文似的字符串，替代了你用一大篇幅的 if else 代碼來(lái)做一些數(shù)據(jù)校驗(yàn)。

1. 元字符

萬(wàn)物皆有緣，正則也是如此，元字符是構(gòu)造正則表達(dá)式的一種基本元素。

我們先來(lái)記幾個(gè)常用的元字符：

有了元字符之后，我們就可以利用這些元字符來(lái)寫(xiě)一些簡(jiǎn)單的正則表達(dá)式了，

比如：

匹配有abc開(kāi)頭的字符串：

\babc或者^(guò)abc

匹配8位數(shù)字的QQ號(hào)碼：

^\d\d\d\d\d\d\d\d$

匹配1開(kāi)頭11位數(shù)字的手機(jī)號(hào)碼：

^\1\d\d\d\d\d\d\d\d\d\d$

2. 重復(fù)限定符

為了處理這些重復(fù)問(wèn)題，正則表達(dá)式中一些重復(fù)限定符，把重復(fù)部分用合適的限定符替代，下面我們來(lái)看一些限定符：

有了這些限定符之后，我們就可以對(duì)之前的正則表達(dá)式進(jìn)行改造了，比如：

匹配8位數(shù)字的QQ號(hào)碼：

^\d{8}$

匹配1開(kāi)頭11位數(shù)字的手機(jī)號(hào)碼：

^1\d{10}$

匹配銀行卡號(hào)是14~18位的數(shù)字：

^\d{14,18}$

匹配以a開(kāi)頭的，0個(gè)或多個(gè)b結(jié)尾的字符串:

^ab*$

3. 分組

從上面的例子（4）中看到，限定符是作用在與他左邊最近的一個(gè)字符，那么問(wèn)題來(lái)了，如果我想要 ab 同時(shí)被限定那怎么辦呢？

正則表達(dá)式中用小括號(hào) () 來(lái)做分組，也就是括號(hào)中的內(nèi)容作為一個(gè)整體。

因此當(dāng)我們要匹配多個(gè) ab 時(shí)，我們可以這樣。

如：匹配字符串中包含 0 到多個(gè) ab 開(kāi)頭：

^(ab)*$

4. 轉(zhuǎn)義

我們看到正則表達(dá)式用小括號(hào)來(lái)做分組，那么問(wèn)題來(lái)了：

如果要匹配的字符串中本身就包含小括號(hào)，那是不是沖突？應(yīng)該怎么辦？

針對(duì)這種情況，正則提供了轉(zhuǎn)義的方式，也就是要把這些元字符、限定符或者關(guān)鍵字轉(zhuǎn)義成普通的字符，做法很簡(jiǎn)答，就是在要轉(zhuǎn)義的字符前面加個(gè)斜杠，也就是\即可。如：要匹配以 (ab) 開(kāi)頭：

^($ab$)*$

5. 條件或

回到我們剛才的手機(jī)號(hào)匹配，我們都知道：國(guó)內(nèi)號(hào)碼都來(lái)自三大網(wǎng)，它們都有屬于自己的號(hào)段，比如聯(lián)通有 130/131/132/155/156/185/186/145/176 等號(hào)段，假如讓我們匹配一個(gè)聯(lián)通的號(hào)碼，那按照我們目前所學(xué)到的正則，應(yīng)該無(wú)從下手的，因?yàn)檫@里包含了一些并列的條件，也就是“或”，那么在正則中是如何表示“或”的呢？

正則用符號(hào) | 來(lái)表示或，也叫做分支條件，當(dāng)滿足正則里的分支條件的任何一種條件時(shí)，都會(huì)當(dāng)成是匹配成功。

那么我們就可以用或條件來(lái)處理這個(gè)問(wèn)題：

^(130|131|132|155|156|185|186|145|176)\d{8}$

6. 區(qū)間

看到上面的例子，是不是看到有什么規(guī)律？是不是還有一種想要簡(jiǎn)化的沖動(dòng)？

實(shí)際是有的。

正則提供一個(gè)元字符中括號(hào) [] 來(lái)表示區(qū)間條件:

限定 0 到 9 可以寫(xiě)成 [0-9]

限定 A-Z 寫(xiě)成 [A-Z]

限定某些數(shù)字 [165]

那上面的正則我們還改成這樣：

?^((13[0-2])|(15[56])|(18[5-6])|145|176)\d{8}$

7. 零寬斷言

無(wú)論是零寬還是斷言，聽(tīng)起來(lái)都古古怪怪的，那先解釋一下這兩個(gè)詞。

斷言：俗話的斷言就是“我斷定什么什么”，而正則中的斷言，就是說(shuō)正則可以指明在指定的內(nèi)容的前面或后面會(huì)出現(xiàn)滿足指定規(guī)則的內(nèi)容，意思正則也可以像人類(lèi)那樣斷定什么什么，比如"ss1aa2bb3", 正則可以用斷言找出 aa2 前面有 bb3，也可以找出 aa2 后面有 ss1.

零寬：就是沒(méi)有寬度，在正則中，斷言只是匹配位置，不占字符，也就是說(shuō)，匹配結(jié)果里是不會(huì)返回?cái)嘌员旧怼?/p>

意思是講明白了，那他有什么用呢？

我們來(lái)舉個(gè)栗子：

假設(shè)我們要用爬蟲(chóng)抓取 csdn 里的文章閱讀量。通過(guò)查看源代碼可以看到文章閱讀量這個(gè)內(nèi)容是這樣的結(jié)構(gòu):

其中只有‘641’這個(gè)是一個(gè)變量，也就是不同文章有不同的值，當(dāng)我們拿到這個(gè)字符串時(shí)，需要獲得這里邊的‘641’有很多種辦法，但如果使用正則應(yīng)該怎么匹配呢？

下面先講一下幾種類(lèi)型的斷言：

1、正向先行斷言（正前瞻）

語(yǔ)法：（?=pattern）

作用：匹配 pattern 表達(dá)式的前面內(nèi)容，不返回本身。

這樣子說(shuō)，還是一臉懵逼，好吧，回歸剛才那個(gè)栗子，要取到閱讀量，在正則表達(dá)式中就意味著要能匹配到‘</span>’前面的數(shù)字內(nèi)容按照上所說(shuō)的正向先行斷言可以匹配表達(dá)式前面的內(nèi)容，那意思就是:(?=</span>) 就可以匹配到前面的內(nèi)容了。匹配什么內(nèi)容呢？如果要所有內(nèi)容那就是：

可是老哥我們要的只是前面的數(shù)字呀，那也簡(jiǎn)單咯，匹配數(shù)字 \d, 那可以改成：

大功告成！

2、正向后行斷言（正后顧）

語(yǔ)法：（?<=pattern）

作用：匹配 pattern 表達(dá)式的后面的內(nèi)容，不返回本身。

有先行就有后行，先行是匹配前面的內(nèi)容，那后行就是匹配后面的內(nèi)容啦。

上面的栗子，我們也可以用后行斷言來(lái)處理：

3、負(fù)向先行斷言（負(fù)前瞻）

語(yǔ)法：(?!pattern)

作用：匹配非 pattern 表達(dá)式的前面內(nèi)容，不返回本身。

有正向也有負(fù)向，負(fù)向在這里其實(shí)就是非的意思。

舉個(gè)栗子：比如有一句 “我愛(ài)祖國(guó)，我是祖國(guó)的花朵”

現(xiàn)在要找到不是'的花朵'前面的祖國(guó)

用正則就可以這樣寫(xiě)：

祖國(guó)(?!的花朵)

4、負(fù)向后行斷言（負(fù)后顧）

語(yǔ)法：(?<!pattern)

作用：匹配非 pattern 表達(dá)式的后面內(nèi)容，不返回本身。

8. 捕獲和非捕獲

單純說(shuō)到捕獲，他的意思是匹配表達(dá)式，但捕獲通常和分組聯(lián)系在一起，也就是“捕獲組”。

捕獲組：匹配子表達(dá)式的內(nèi)容，把匹配結(jié)果保存到內(nèi)存中中數(shù)字編號(hào)或顯示命名的組里，以深度優(yōu)先進(jìn)行編號(hào)，之后可以通過(guò)序號(hào)或名稱來(lái)使用這些匹配結(jié)果。

而根據(jù)命名方式的不同，又可以分為兩種組：

1、數(shù)字編號(hào)捕獲組：

解釋：從表達(dá)式左側(cè)開(kāi)始，每出現(xiàn)一個(gè)左括號(hào)和它對(duì)應(yīng)的右括號(hào)之間的內(nèi)容為一個(gè)分組，在分組中，第 0 組為整個(gè)表達(dá)式，第一組開(kāi)始為分組。

比如固定電話的：020-85653333

他的正則表達(dá)式為：(0\d{2})-(\d{8})

按照左括號(hào)的順序，這個(gè)表達(dá)式有如下分組：

我們用Java來(lái)驗(yàn)證一下：

輸出結(jié)果：

可見(jiàn)，分組個(gè)數(shù)是2，但是因?yàn)榈?個(gè)為整個(gè)表達(dá)式本身，因此也一起輸出了。

2、命名編號(hào)捕獲組

語(yǔ)法：(?<name>exp)

解釋：分組的命名由表達(dá)式中的 name 指定

比如區(qū)號(hào)也可以這樣寫(xiě):(?\0\d{2})-(?\d{8})，按照左括號(hào)的順序，這個(gè)表達(dá)式有如下分組：

用代碼來(lái)驗(yàn)證一下：

輸出結(jié)果：

3、非捕獲組

語(yǔ)法：(?:exp)

解釋：和捕獲組剛好相反，它用來(lái)標(biāo)識(shí)那些不需要捕獲的分組，說(shuō)的通俗一點(diǎn)，就是你可以根據(jù)需要去保存你的分組。

比如上面的正則表達(dá)式，程序不需要用到第一個(gè)分組，那就可以這樣寫(xiě)：

(?:\0\d{2})-(\d{8})

驗(yàn)證一下：

輸出結(jié)果：

9. 反向引用

上面講到捕獲，我們知道：捕獲會(huì)返回一個(gè)捕獲組，這個(gè)分組是保存在內(nèi)存中，不僅可以在正則表達(dá)式外部通過(guò)程序進(jìn)行引用，也可以在正則表達(dá)式內(nèi)部進(jìn)行引用，這種引用方式就是反向引用。

根據(jù)捕獲組的命名規(guī)則，反向引用可分為：

數(shù)字編號(hào)組反向引用：\k 或\number

命名編號(hào)組反向引用：\k 或者\(yùn)'name'

好了講完了，懂嗎？不懂?。。?/p>

可能連前面講的捕獲有什么用都還不懂吧？

其實(shí)只是看完捕獲不懂不會(huì)用是很正常的！

因?yàn)椴东@組通常是和反向引用一起使用的

上面說(shuō)到捕獲組是匹配子表達(dá)式的內(nèi)容按序號(hào)或者命名保存起來(lái)以便使用。

注意兩個(gè)字眼：“內(nèi)容” 和 “使用”。

這里所說(shuō)的“內(nèi)容”，是匹配結(jié)果，而不是子表達(dá)式本身，強(qiáng)調(diào)這個(gè)有什么用？嗯，先記住。

那這里所說(shuō)的“使用”是怎樣使用呢？

因?yàn)樗淖饔弥饕怯脕?lái)查找一些重復(fù)的內(nèi)容或者做替換指定字符。

還是舉栗子吧：

比如要查找一串字母"aabbbbgbddesddfiid"里成對(duì)的字母。

如果按照我們之前學(xué)到的正則，什么區(qū)間啊限定啊斷言啊可能是辦不到的，現(xiàn)在我們先用程序思維理一下思路：

1）匹配到一個(gè)字母

2）匹配第下一個(gè)字母，檢查是否和上一個(gè)字母是否一樣

3）如果一樣，則匹配成功，否則失敗

這里的思路 2 中匹配下一個(gè)字母時(shí)，需要用到上一個(gè)字母，那怎么記住上一個(gè)字母呢？？？

這下子捕獲就有用處啦，我們可以利用捕獲把上一個(gè)匹配成功的內(nèi)容用來(lái)作為本次匹配的條件。

好了，有思路就要實(shí)踐

首先匹配一個(gè)字母：\w，我們需要做成分組才能捕獲，因此寫(xiě)成這樣：(\w)

那這個(gè)表達(dá)式就有一個(gè)捕獲組：（\w）

然后我們要用這個(gè)捕獲組作為條件，那就可以：(\w)\1這樣就大功告成了

可能有人不明白了，\1 是什么意思呢？

還記得捕獲組有兩種命名方式嗎，一種是是根據(jù)捕獲分組順序命名，一種是自定義命名來(lái)作為捕獲組的命名在默認(rèn)情況下都是以數(shù)字來(lái)命名，而且數(shù)字命名的順序是從 1 開(kāi)始的。

因此要引用第一個(gè)捕獲組，根據(jù)反向引用的數(shù)字命名規(guī)則就需要 \k<1>或者\(yùn)1，當(dāng)然，通常都是是后者。

我們來(lái)測(cè)試一下：

輸出結(jié)果：

嗯，這就是我們想要的了。

在舉個(gè)替換的例子，假如想要把字符串中abc換成a。

輸出結(jié)果：

abbabcgbddesddfiid

10. 貪婪和非貪婪

1、貪婪

我們都知道，貪婪就是不滿足，盡可能多的要。在正則中，貪婪也是差不多的意思:

貪婪匹配：當(dāng)正則表達(dá)式中包含能接受重復(fù)的限定符時(shí)，通常的行為是（在使整個(gè)表達(dá)式能得到匹配的前提下）匹配盡可能多的字符，這匹配方式叫做貪婪匹配。

特性：一次性讀入整個(gè)字符串進(jìn)行匹配，每當(dāng)不匹配就舍棄最右邊一個(gè)字符，繼續(xù)匹配，依次匹配和舍棄（這種匹配 - 舍棄的方式也叫做回溯），直到匹配成功或者把整個(gè)字符串舍棄完為止，因此它是一種最大化的數(shù)據(jù)返回，能多不會(huì)少。

前面我們講過(guò)重復(fù)限定符，其實(shí)這些限定符就是貪婪量詞，比如表達(dá)式：

\d{3,6}

用來(lái)匹配3到6位數(shù)字，在這種情況下，它是一種貪婪模式的匹配，也就是假如字符串里有6個(gè)個(gè)數(shù)字可以匹配，那它就是全部匹配到。

如:

輸出結(jié)果：

由結(jié)果可見(jiàn)：本來(lái)字符串中的“61762828”這一段，其實(shí)只需要出現(xiàn)3個(gè)（617）就已經(jīng)匹配成功了的，但是他并不滿足，而是匹配到了最大能匹配的字符，也就是6個(gè)。

一個(gè)量詞就如此貪婪了，那有人會(huì)問(wèn)，如果多個(gè)貪婪量詞湊在一起，那他們是如何支配自己的匹配權(quán)的呢？

是這樣的，多個(gè)貪婪在一起時(shí)，如果字符串能滿足他們各自最大程度的匹配時(shí)，就互不干擾，但如果不能滿足時(shí)，會(huì)根據(jù)深度優(yōu)先原則，也就是從左到右的每一個(gè)貪婪量詞，優(yōu)先最大數(shù)量的滿足，剩余再分配下一個(gè)量詞匹配。

輸出結(jié)果：

“617628” 是前面的\d{1,2}匹配出了 61，后面的匹配出了 7628

"2991" 是前面的\d{1,2}匹配出了2 ，后面的匹配出了991(滿足匹配優(yōu)先，再最大程度的貪婪)

"87321"是前面的\d{1,2}匹配出了 87，后面的匹配出了 321

?2、懶惰（非貪婪）

懶惰匹配：當(dāng)正則表達(dá)式中包含能接受重復(fù)的限定符時(shí)，通常的行為是（在使整個(gè)表達(dá)式能得到匹配的前提下）匹配盡可能少的字符，這匹配方式叫做懶惰匹配。

特性：從左到右，從字符串的最左邊開(kāi)始匹配，每次試圖不讀入字符匹配，匹配成功，則完成匹配，否則讀入一個(gè)字符再匹配，依此循環(huán)（讀入字符、匹配）直到匹配成功或者把字符串的字符匹配完為止。

懶惰量詞是在貪婪量詞后面加個(gè)“？”

輸出結(jié)果：

解答：

“61762” 是左邊的懶惰匹配出 6，右邊的貪婪匹配出 1762

"2991" 是左邊的懶惰匹配出 2，右邊的貪婪匹配出 991

"87321" 左邊的懶惰匹配出 8，右邊的貪婪匹配出 7321

11. 反義

前面說(shuō)到元字符的都是要匹配什么什么，當(dāng)然如果你想反著來(lái)，不想匹配某些字符，正則也提供了一些常用的反義元字符：

正則知識(shí)就講到這里，正則是一門(mén)博大精深的語(yǔ)言，其實(shí)學(xué)會(huì)它的一些語(yǔ)法和知識(shí)點(diǎn)還算不太難，但想要做到真正學(xué)以致用能寫(xiě)出非常 6 的正則，還有很遠(yuǎn)的距離，只有真正對(duì)它感興趣的，并且經(jīng)常研究和使用它，才會(huì)漸漸的理解它的博大精深之處。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

正則表達(dá)式真的很6