久久福利网站,人人舔成人在线

一、RegExp 構(gòu)造函數(shù)

1、ES5的寫法：

正確的：

var regex = new RegExp('xyz', 'i');
var regex = /xyz/i;
var regex = new RegExp(/xyz/i);

不正確的：參數(shù)是一個正則表示式，這時會返回一個原有正則表達式的拷貝,ES5 不允許此時使用第二個參數(shù)添加修飾符，否則會報錯。

var regex = new RegExp(/xyz/, 'i');

2、ES6 改變了這種行為。如果RegExp構(gòu)造函數(shù)第一個參數(shù)是一個正則對象，那么可以使用第二個參數(shù)指定修飾符。而且，返回的正則表達式會忽略原有的正則表達式的修飾符，只使用新指定的修飾符。

new RegExp(/abc/ig, 'i').flags

原有正則對象的修飾符是ig，它會被第二個參數(shù)i覆蓋。

二、字符串的正則方法

match()、replace(、search()和split()

三、u 修飾符

----Unicode 模式 ---->處理大于\uFFFF的 Unicode 字符,----處理四個字節(jié)的 UTF-16 編碼
----ES5 不支持四個字節(jié)的 UTF-16 編碼，會將其識別為兩個字符

/^\uD83D/u.test('\uD83D\uDC2A') // false
/^\uD83D/.test('\uD83D\uDC2A') // true

image.png

一旦加上u修飾符號，就會修改下面這些正則表達式的行為。

（1）點字符

---點（.）字符在正則表達式中，含義是除了換行符以外的任意單個字符。對于碼點大于0xFFFF的 Unicode 字符，點字符不能識別，必須加上u修飾符

var s = '??';
/^.$/.test(s) // false
/^.$/u.test(s) // true

image.png

（2）Unicode 字符表示法

ES6 新增了使用大括號表示 Unicode 字符，這種表示法在正則表達式中必須加上u修飾符，才能識別當(dāng)中的大括號，否則會被解讀為量詞

/\u{61}/.test('a') // false     -------------- a的Unicode碼是61
/\u{61}/u.test('a') // true
/\u{20BB7}/u.test('??') // true

上面代碼表示，如果不加u修飾符，正則表達式無法識別\u{61}這種表示法，只會認(rèn)為這匹配 61 個連續(xù)的u

（3）量詞

----使用u修飾符后，所有量詞都會正確識別碼點大于0xFFFF的 Unicode 字符。

/a{2}/.test('aa') // true
/a{2}/u.test('aa') // true
/??{2}/.test('????') // false
/??{2}/u.test('????') // true

（4）預(yù)定義模式

------u修飾符也影響到預(yù)定義模式，能否正確識別碼點大于0xFFFF的 Unicode 字符

/^\S$/.test('??') // false
/^\S$/u.test('??') // true

（5）i 修飾符

有些 Unicode 字符的編碼不同，但是字型很相近，比如，\u004B與\u212A都是大寫的K

/[a-z]/i.test('\u212A') // false
/[a-z]/iu.test('\u212A') // true

上面代碼中，不加u修飾符，就無法識別非規(guī)范的K字符

四、RegExp.prototype.unicode 屬性

正則實例對象新增unicode屬性，表示是否設(shè)置了u修飾符。

const r1 = /hello/;
const r2 = /hello/u;
r1.unicode // false
r2.unicode // true

image.png

五、y 修飾符(待研究，還沒搞明白)

除了u修飾符，ES6 還為正則表達式添加了y修飾符，--->叫“粘連”（sticky）修飾符。

六、RegExp.prototype.sticky 屬性

---與y修飾符相匹配，ES6 的正則實例對象多了sticky屬性，表示是否設(shè)置了y修飾符

var r = /hello\d/y;
r.sticky // true

image.png

七、RegExp.prototype.flags 屬性

// ES5 的 source 屬性
// 返回正則表達式的正文
/abc/ig.source
// "abc"

// ES6 的 flags 屬性
// 返回正則表達式的修飾符
/abc/ig.flags
// 'gi'

image.png

八、s 修飾符：dotAll 模式

---正則表達式中，點（.）是一個特殊字符，代表任意的單個字符，但是有兩個例外。一個是四個字節(jié)的 UTF-16 字符，這個可以用u修飾符解決；另一個是行終止符。

/foo.bar/.test('foo\nbar')  // false

上面代碼中，因為.不匹配\n，所以正則表達式返回false。
但是，很多時候我們希望匹配的是任意單個字符，這時有一種變通的寫法

/foo[^]bar/.test('foo\nbar') // true

這種解決方案畢竟不太符合直覺，ES2018 引入s修飾符，使得.可以匹配任意單個字符

/foo.bar/s.test('foo\nbar') // true

這被稱為dotAll模式，即點（dot）代表一切字符。所以，正則表達式還引入了一個dotAll屬性，返回一個布爾值，表示該正則表達式是否處在dotAll模式。

const re = /foo.bar/s;
// 另一種寫法
// const re = new RegExp('foo.bar', 's');

re.test('foo\nbar') // true
re.dotAll // true
re.flags // 's'

/s修飾符和多行修飾符/m不沖突，兩者一起使用的情況下，.匹配所有字符，而^和$匹配每一行的行首和行尾。

image.png

九、后行斷言

JavaScript 語言的正則表達式，只支持先行斷言（lookahead）和先行否定斷言（negative lookahead），不支持后行斷言（lookbehind）和后行否定斷言（negative lookbehind）。ES2018 引入后行斷言，V8 引擎 4.9 版（Chrome 62）已經(jīng)支持。
”先行斷言“指的是，x只有在y前面才匹配，必須寫成/x(?=y)/。比如，只匹配百分號之前的數(shù)字，要寫成/\d+(?=%)/?！毕刃蟹穸〝嘌浴爸傅氖?，x只有不在y前面才匹配，必須寫成/x(?!y)/。比如，只匹配不在百分號之前的數(shù)字，要寫成/\d+(?!%)/

/\d+(?=%)/.exec('100% of US presidents have been male') // [100]
/\d+(?!%)/.exec('100% 50 of US presidents have been male') // [10]

image.png

上面兩個字符串，如果互換正則表達式，就不會得到相同結(jié)果。另外，還可以看到，”先行斷言“括號之中的部分（(?=%)），是不計入返回結(jié)果的。
“后行斷言”正好與“先行斷言”相反，x只有在y后面才匹配，必須寫成/(?<=y)x/。比如，只匹配美元符號之后的數(shù)字，要寫成/(?<=\$)\d+/?！焙笮蟹穸〝嘌浴皠t與”先行否定斷言“相反，x只有不在y后面才匹配，必須寫成/(?<!y)x/。比如，只匹配不在美元符號后面的數(shù)字，要寫成/(?<!\$)\d+/。

/(?<=%)\d+/.exec('hsjdhf %10 50 of US presidents have been male')// 10
/(?<!%)\d+/.exec('hsjdhf %1040 50 of US presidents have been male') // 040

image.png

上面的例子中，“后行斷言”的括號之中的部分（(?<=$)），也是不計入返回結(jié)果。
下面的例子是使用后行斷言進行字符串替換。

const RE_DOLLAR_PREFIX = /(?<=\$)foo/g;
'$foo %foo foo'.replace(RE_DOLLAR_PREFIX, 'bar');
// '$bar %foo foo

上面代碼中，只有在美元符號后面的foo才會被替換。
“后行斷言”的實現(xiàn)，需要先匹配/(?<=y)x/的x，然后再回到左邊，匹配y的部分。這種“先右后左”的執(zhí)行順序，與所有其他正則操作相反，導(dǎo)致了一些不符合預(yù)期的行為。
首先，后行斷言的組匹配，與正常情況下結(jié)果是不一樣的

/(?<=(\d+)(\d+))$/.exec('1053') // ["", "1", "053"]
/^(\d+)(\d+)$/.exec('1053') // ["1053", "105", "3"]

上面代碼中，需要捕捉兩個組匹配。沒有“后行斷言”時，第一個括號是貪婪模式，第二個括號只能捕獲一個字符，所以結(jié)果是105和3。而“后行斷言”時，由于執(zhí)行順序是從右到左，第二個括號是貪婪模式，第一個括號只能捕獲一個字符，所以結(jié)果是1和053。
其次，“后行斷言”的反斜杠引用，也與通常的順序相反，必須放在對應(yīng)的那個括號之前。

/(?<=(o)d\1)r/.exec('hodor')  // null
/(?<=\1d(o))r/.exec('hodor')  // ["r", "o"]

上面代碼中，如果后行斷言的反斜杠引用（\1）放在括號的后面，就不會得到匹配結(jié)果，必須放在前面才可以。因為后行斷言是先從左到右掃描，發(fā)現(xiàn)匹配以后再回過頭，從右到左完成反斜杠引用。

十、Unicode 屬性類

ES2018 引入了一種新的類的寫法\p{...}和\P{...}，允許正則表達式匹配符合 Unicode 某種屬性的所有字符。

const regexGreekSymbol = /\p{Script=Greek}/u;
regexGreekSymbol.test('π') // true

上面代碼中，\p{Script=Greek}指定匹配一個希臘文字母，所以匹配π成功。
Unicode 屬性類要指定屬性名和屬性值。

\p{UnicodePropertyName=UnicodePropertyValue}

對于某些屬性，可以只寫屬性名，或者只寫屬性值。

\p{UnicodePropertyName}
\p{UnicodePropertyValue}

\P{…}是\p{…}的反向匹配，即匹配不滿足條件的字符。
注意，這兩種類只對 Unicode有效，所以使用的時候一定要加上u修飾符。如果不加u修飾符，正則表達式使用\p和\P會報錯，ECMAScript 預(yù)留了這兩個類。
由于 Unicode 的各種屬性非常多，所以這種新的類的表達能力非常強。

const regex = /^\p{Decimal_Number}+$/u;
regex.test('????????????????????????????????') // true

上面代碼中，屬性類指定匹配所有十進制字符，可以看到各種字型的十進制字符都會匹配成功
\p{Number}甚至能匹配羅馬數(shù)字。

// 匹配所有數(shù)字
const regex = /^\p{Number}+$/u;
regex.test('231???') // true
regex.test('???') // true
regex.test('ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ') // true

下面是其他一些例子

// 匹配所有空格
\p{White_Space}

// 匹配各種文字的所有字母，等同于 Unicode 版的 \w
[\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Connector_Punctuation}\p{Join_Control}]

// 匹配各種文字的所有非字母的字符，等同于 Unicode 版的 \W
[^\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Connector_Punctuation}\p{Join_Control}]

// 匹配 Emoji
/\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F/gu

// 匹配所有的箭頭字符
const regexArrows = /^\p{Block=Arrows}+$/u;
regexArrows.test('←↑→↓??↖↗↘↙?????????????') // true

十一、具名組匹配

正則表達式使用圓括號進行組匹配。

const RE_DATE = /(\d{4})-(\d{2})-(\d{2})/;

上面代碼中，正則表達式里面有三組圓括號。使用exec方法，就可以將這三組匹配結(jié)果提取出來。

const RE_DATE = /(\d{4})-(\d{2})-(\d{2})/;

const matchObj = RE_DATE.exec('1999-12-31');
const year = matchObj[1]; // 1999
const month = matchObj[2]; // 12
const day = matchObj[3]; // 31

組匹配的一個問題是，每一組的匹配含義不容易看出來，而且只能用數(shù)字序號（比如matchObj[1]）引用，要是組的順序變了，引用的時候就必須修改序號。
ES2018 引入了具名組匹配（Named Capture Groups），允許為每一個組匹配指定一個名字，既便于閱讀代碼，又便于引用。

const RE_DATE = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/;

const matchObj = RE_DATE.exec('1999-12-31');
const year = matchObj.groups.year; // 1999
const month = matchObj.groups.month; // 12
const day = matchObj.groups.day; // 31

上面代碼中，“具名組匹配”在圓括號內(nèi)部，模式的頭部添加“問號 + 尖括號 + 組名”（?<year>），然后就可以在exec方法返回結(jié)果的groups屬性上引用該組名。同時，數(shù)字序號（matchObj[1]）依然有效
具名組匹配等于為每一組匹配加上了 ID，便于描述匹配的目的。如果組的順序變了，也不用改變匹配后的處理代碼
如果具名組沒有匹配，那么對應(yīng)的groups對象屬性會是undefined。

const RE_OPT_A = /^(?<as>a+)?$/;
const matchObj = RE_OPT_A.exec('');

matchObj.groups.as // undefined
'as' in matchObj.groups // true

上面代碼中，具名組as沒有找到匹配，那么matchObj.groups.as屬性值就是undefined，并且as這個鍵名在groups是始終存在的。

解構(gòu)賦值和替換

有了具名組匹配以后，可以使用解構(gòu)賦值直接從匹配結(jié)果上為變量賦值。

let {groups: {one, two}} = /^(?<one>.*):(?<two>.*)$/u.exec('foo:bar');
one  // foo
two  // bar

字符串替換時，使用$<組名>引用具名組。

let re = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;
'2015-01-02'.replace(re, '$<day>/$<month>/$<year>')
// '02/01/2015'

上面代碼中，replace方法的第二個參數(shù)是一個字符串，而不是正則表達式。
replace方法的第二個參數(shù)也可以是函數(shù)，該函數(shù)的參數(shù)序列如下。

'2015-01-02'.replace(re, (
   matched, // 整個匹配結(jié)果 2015-01-02
   capture1, // 第一個組匹配 2015
   capture2, // 第二個組匹配 01
   capture3, // 第三個組匹配 02
   position, // 匹配開始的位置 0
   S, // 原字符串 2015-01-02
   groups // 具名組構(gòu)成的一個對象 {year, month, day}
 ) => {
 let {day, month, year} = args[args.length - 1];
 return `${day}/${month}/${year}`;
});

具名組匹配在原來的基礎(chǔ)上，新增了最后一個函數(shù)參數(shù)：具名組構(gòu)成的一個對象。函數(shù)內(nèi)部可以直接對這個對象進行解構(gòu)賦值。

引用

如果要在正則表達式內(nèi)部引用某個“具名組匹配”，可以使用\k<組名>的寫法。

const RE_TWICE = /^(?<word>[a-z]+)!\k<word>$/;
RE_TWICE.test('abc!abc') // true
RE_TWICE.test('abc!ab') // false

數(shù)字引用（\1）依然有效。

const RE_TWICE = /^(?<word>[a-z]+)!\1$/;
RE_TWICE.test('abc!abc') // true
RE_TWICE.test('abc!ab') // false

這兩種引用語法還可以同時使用。

const RE_TWICE = /^(?<word>[a-z]+)!\k<word>!\1$/;
RE_TWICE.test('abc!abc!abc') // true
RE_TWICE.test('abc!abc!ab') // false

十二、String.prototype.matchAll

如果一個正則表達式在字符串里面有多個匹配，現(xiàn)在一般使用g修飾符或y修飾符，在循環(huán)里面逐一取出。

var regex = /t(e)(st(\d?))/g;
var string = 'test1test2test3';

var matches = [];
var match;
while (match = regex.exec(string)) {
  matches.push(match);
}

matches
// [
//   ["test1", "e", "st1", "1", index: 0, input: "test1test2test3"],
//   ["test2", "e", "st2", "2", index: 5, input: "test1test2test3"],
//   ["test3", "e", "st3", "3", index: 10, input: "test1test2test3"]
// ]

上面代碼中，while循環(huán)取出每一輪的正則匹配，一共三輪。
目前有一個提案，增加了String.prototype.matchAll方法，可以一次性取出所有匹配。不過，它返回的是一個遍歷器（Iterator），而不是數(shù)組。

const string = 'test1test2test3';

// g 修飾符加不加都可以
const regex = /t(e)(st(\d?))/g;

for (const match of string.matchAll(regex)) {
  console.log(match);
}
// ["test1", "e", "st1", "1", index: 0, input: "test1test2test3"]
// ["test2", "e", "st2", "2", index: 5, input: "test1test2test3"]
// ["test3", "e", "st3", "3", index: 10, input: "test1test2test3"]

上面代碼中，由于string.matchAll(regex)返回的是遍歷器，所以可以用for...of循環(huán)取出。相對于返回數(shù)組，返回遍歷器的好處在于，如果匹配結(jié)果是一個很大的數(shù)組，那么遍歷器比較節(jié)省資源。

遍歷器轉(zhuǎn)為數(shù)組是非常簡單的，使用...運算符和Array.from方法就可以了。

// 轉(zhuǎn)為數(shù)組方法一
[...string.matchAll(regex)]

// 轉(zhuǎn)為數(shù)組方法二
Array.from(string.matchAll(regex));

----源于阮一峰老師的es6語法-----，我都親手敲過一次，測試，非常ok-----

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

05、正則的擴展

05、正則的擴展

一、RegExp 構(gòu)造函數(shù)

1、ES5的寫法：

2、ES6 改變了這種行為。如果RegExp構(gòu)造函數(shù)第一個參數(shù)是一個正則對象，那么可以使用第二個參數(shù)指定修飾符。而且，返回的正則表達式會忽略原有的正則表達式的修飾符，只使用新指定的修飾符。

二、字符串的正則方法

三、u 修飾符

一旦加上u修飾符號，就會修改下面這些正則表達式的行為。

（1）點字符

（2）Unicode 字符表示法

（3）量詞

（4）預(yù)定義模式

（5）i 修飾符

四、RegExp.prototype.unicode 屬性

五、y 修飾符(待研究，還沒搞明白)

六、RegExp.prototype.sticky 屬性

七、RegExp.prototype.flags 屬性

八、s 修飾符：dotAll 模式

九、后行斷言

十、Unicode 屬性類

十一、具名組匹配

解構(gòu)賦值和替換

引用

十二、String.prototype.matchAll

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

05、正則的擴展

一、RegExp 構(gòu)造函數(shù)

1、ES5的寫法：

二、字符串的正則方法

三、u 修飾符

一旦加上u修飾符號，就會修改下面這些正則表達式的行為。

（1）點字符

（2）Unicode 字符表示法

（3）量詞

（4）預(yù)定義模式

（5）i 修飾符

四、RegExp.prototype.unicode 屬性

五、y 修飾符(待研究，還沒搞明白)

六、RegExp.prototype.sticky 屬性

七、RegExp.prototype.flags 屬性

八、s 修飾符：dotAll 模式

九、后行斷言

十、Unicode 屬性類

十一、具名組匹配

解構(gòu)賦值和替換

引用

十二、String.prototype.matchAll

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

05、正則的擴展

一、RegExp 構(gòu)造函數(shù)

二、字符串的正則方法

一旦加上u修飾符號，就會修改下面這些正則表達式的行為。

四、RegExp.prototype.unicode 屬性

五、y 修飾符(待研究，還沒搞明白)

六、RegExp.prototype.sticky 屬性

七、RegExp.prototype.flags 屬性

九、后行斷言

十、Unicode 屬性類

十二、String.prototype.matchAll