一、正則表達(dá)式基本概念
1.什么是正則表達(dá)式 正則表達(dá)式,又稱正規(guī)表示法,是對字符串操作的一種邏輯公式。 正則表達(dá)式可以檢測 給定的字符串是否符合我們定義的邏輯,也可以從字符串中獲取我們想要的特定部分。它可以 迅速地用極簡單的方式達(dá)到字符串的復(fù)雜控制。
2.什么是謂詞 Cocoa框架中的NSPredicate用于查詢,原理和用法都類似于SQL中的where,作用相當(dāng)于數(shù)據(jù)庫的過濾取。 我們可以編寫簡單的謂詞語句,就可以從數(shù)組中過濾出我們想要的數(shù)據(jù)。
二.正則表達(dá)式的使用
//正則表達(dá)式的使用
(void)useRegularExpressions
{
** #pragma mark 1.正則表達(dá)式規(guī)則**** **
/-------------------------------1.1普通字符-------------------------------/
// 字母、數(shù)字、漢字、下劃線、非特殊定義的標(biāo)點符號,都是"普通字符"。表達(dá)式中的普通字符,在匹配一個字符串的時候,匹配與之相同的一個字符。
NSString *searchString1_1 = @"abcde";
NSString *regexString1_1 = @"c";
NSString *matchedString1_1 = [searchString1_1 stringByMatching:regexString1_1];
NSLog(@"matchedString1_1:%@",matchedString1_1); // 輸出結(jié)果: c
/-------------------------------1.2簡單的轉(zhuǎn)義字符-------------------------------/
// 一些不便書寫的字符,在前面加 "",如:\n,\t,\ 等
NSString *searchString1_2 = @"abc$de";
// 記住在字符串中“\”需要用“\”表示
NSString *regexString1_2 = @"$d";
NSString *matchedString1_2 = [searchString1_2 stringByMatching:regexString1_2];
NSLog(@"matchedString1_2:%@",matchedString1_2); // 輸出結(jié)果: $d
/------------------------1.3能夠與 '多種字符' 匹配的表達(dá)式-------------------------/
/*
. : 匹配除換行符以外的任意字符
\w : 匹配字母或數(shù)字或下劃線或漢字
\s : 匹配任意的空白符
\d : 匹配數(shù)字
\b : 匹配單詞的開始或結(jié)束
*/
NSString *searchString1_3 = @"abc123";
// 正則表達(dá)式有一條規(guī)則:最先開始的匹配擁有最高的優(yōu)先權(quán)
NSString *regexString1_3 = @"\d\d";
NSString *matchedString1_3 = [searchString1_3 stringByMatching:regexString1_3];
NSLog(@"matchedString1_3:%@",matchedString1_3); // 輸出結(jié)果: 12
/---------------------1.4自定義能夠匹配 '多種字符' 的表達(dá)式-------------------------/
// 使用方括號 [ ] 包含一系列字符,能夠匹配其中任意一個字符。用 [^ ] 包含一系列字符,則能夠匹配其中字符之外的任意一個字符。同樣的道理,雖然可以匹配其中任意一個,但是只能是一個,不是多個。[]本身就隱含了“或”的關(guān)系,在[]中使用“|”表示“或”的關(guān)系是不對的,這樣做只是多了一個普通字符“|”,用來匹配“|”字符本身,()也是同樣道理。 如:
/*
[ab5@] : 匹配 "a" 或 "b" 或 "5" 或 "@"
[^abc] : 匹配 "a","b","c" 之外的任意一個字符
[f-k] : 匹配 "f"~"k" 之間的任意一個字母
[^A-F0-3] : 匹配 "A""F","0""3" 之外的任意一個字符
*/
NSString *searchString1_4 = @"abc123";
NSString *regexString1_4 = @"[bcd][bcd]";
NSString *matchedString1_4 = [searchString1_4 stringByMatching:regexString1_4];
NSLog(@"matchedString1_4:%@",matchedString1_4); // 輸出結(jié)果: bc
/---------------------1.5修飾匹配次數(shù)的特殊符號------------------------------/
// 使用表達(dá)式再加上修飾匹配次數(shù)的特殊符號,那么不用重復(fù)書寫表達(dá)式就可以重復(fù)匹配
/*
{n} : 表達(dá)式重復(fù)n次
{m,n} : 表達(dá)式至少重復(fù)m次,最多重復(fù)n次
{m,} : 表達(dá)式至少重復(fù)m次
? : 匹配表達(dá)式0次或者1次,相當(dāng)于 {0,1}
+ : 表達(dá)式至少出現(xiàn)1次,相當(dāng)于 {1,}
* : 表達(dá)式不出現(xiàn)或出現(xiàn)任意次,相當(dāng)于 {0,}
*/
NSString *searchString1_5 = @"It costs $12.5";
NSString *regexString1_5 = @"\d+\.?\d";
NSString *matchedString1_5 = [searchString1_5 stringByMatching:regexString1_5];
NSLog(@"matchedString1_5:%@",matchedString1_5); // 輸出結(jié)果: 12.5
/---------------------1.6其他一些代表抽象意義的特殊符號--------------------------/
// 一些符號在表達(dá)式中代表抽象的特殊意義
/*
^ : 與字符串開始的地方匹配,不匹配任何字符
$ : 與字符串結(jié)束的地方匹配,不匹配任何字符
\b : 匹配一個單詞邊界,也就是單詞和空格之間的位置,不匹配任何字符
*/
// 進(jìn)一步說明:"\b" 與 "^" 和 "$" 類似,本身不匹配任何字符,但是它要求它在匹配結(jié)果中所處位置的左右兩邊,其中一邊是 "\w" 范圍,另一邊是 非"\w" 的范圍
NSString *searchString1_6 = @"@@@abc";
NSString *regexString1_6 = @".\b.";
NSString *matchedString1_6 = [searchString1_6 stringByMatching:regexString1_6];
NSLog(@"matchedString1_6:%@",matchedString1_6); // 輸出結(jié)果: @a
pragma mark 2.正則表達(dá)式中的一些高級規(guī)則
/---------------------2.1匹配次數(shù)中的貪婪與非貪婪--------------------------/
// 1)在使用修飾匹配次數(shù)的特殊符號"{m,n}", "{m,}", "?", "*", "+"可以使同一個表達(dá)式能夠匹配不同的次數(shù),這種重復(fù)匹配不定次數(shù)的表達(dá)式在匹配過程中,總是盡可能多的匹配。如:
NSString *searchString2_1_1 = @"dxxxdxxxd";
NSString *regexString2_1_1 = @"(d)(\w+)(d)";
NSString *matchedString2_1_1 = [searchString2_1_1 stringByMatching:regexString2_1_1];
NSLog(@"matchedString2_1_1:%@",matchedString2_1_1); // 輸出結(jié)果: dxxxdxxxd
// 2)在修飾匹配次數(shù)的特殊符號后再加上一個 "?" 號,則可以使匹配次數(shù)不定的表達(dá)式盡可能少的匹配,這種匹配原則叫作 "非貪婪" 模式,也叫作 "勉強(qiáng)" 模式
NSString *regexString2_1_2 = @"(d)(\w+?)(d)";
NSString *matchedString2_1_2 = [searchString2_1_1 stringByMatching:regexString2_1_2];
NSLog(@"matchedString2_1_2:%@",matchedString2_1_2); // 輸出結(jié)果: dxxxd
/---------------------2.2反向引用--------------------------------------/
// 使用小括號指定一個子表達(dá)式后,匹配這個子表達(dá)式的文本(也就是此分組捕獲的內(nèi)容)可以在表達(dá)式或其它程序中作進(jìn)一步的處理。默認(rèn)情況下,每個分組會自動擁有一個組號,規(guī)則是:從左向右,以分組的左括號為標(biāo)志,第一個出現(xiàn)的分組的組號為1,第二個為2,以此類推
NSString *searchString2_2 = @"Go go";
NSString *regexString2_2 = @"\b(\w+)\b\s+\1\b";
NSString *matchedString2_2 = [searchString2_2 stringByMatching:regexString2_2];
NSLog(@"matchedString2_2:%@",matchedString2_2); // 輸出結(jié)果: go go
/----------------2.3零寬斷言-------------------------------------------/
// 零寬斷言用于查找在某些內(nèi)容(但并不包括這些內(nèi)容)之前或之后的東西,也就是說它們像\b,^,$那樣用于指定一個位置,這個位置應(yīng)該滿足一定的條件(即斷言),因此它們也被稱為零寬斷言
/*
1)捕獲
(exp) : 匹配exp,并捕獲文本到自動命名的組里
(?<name>exp) : 匹配exp,并捕獲文本到名稱為name的組里,也可以寫成(?'name'exp)
(?:exp) : 匹配exp,不捕獲匹配的文本,也不給此分組分配組號零寬斷言,可節(jié)約性能,提高效率
2)零寬斷言
(?=exp) : 匹配exp前面的位置
(?<=exp) : 匹配exp后面的位置
(?!exp) : 匹配后面跟的不是exp的位置
(?<!exp) : 匹配前面不是exp的位置注釋(?#comment)這種類型的分組不對正則表達(dá)式的處理產(chǎn)生任何影響,用于提供注釋讓人閱讀
*/
NSString *searchString2_3 = @"I'm singing while you're dancing.";
NSString *regexString2_3 = @"\b\w+(?=ing\b)";
NSArray *matchedString2_3 = [searchString2_3 componentsMatchedByRegex:regexString2_3];
NSLog(@"matchedString2_3:%@",matchedString2_3); // 輸出結(jié)果: (sing,danc)
// 3.其他通用規(guī)則
/----------------3.1------------------------------------------/
// 表達(dá)式中,可以使用 "\xXX" 和 "\uXXXX" 表示一個字符("X" 表示一個十六進(jìn)制數(shù))
/*
\xXX : 編號在 0 ~ 255 范圍的字符,比如:空格可以使用 "\x20" 表示
\uXXXX : 任何字符可以使用 "\u" 再加上其編號的4位十六進(jìn)制數(shù)表示,比如:"\u4E2D"
*/
/----------------3.2------------------------------------------/
// 在表達(dá)式 "\s","\d","\w","\b" 表示特殊意義的同時,對應(yīng)的大寫字母表示相反的意義
/*
\S : 匹配所有非空白字符("\s" 可匹配各個空白字符)
\D : 匹配所有的非數(shù)字字符
\W : 匹配所有的字母、數(shù)字、下劃線以外的字符
\B : 匹配非單詞邊界,即左右兩邊都是 "\w" 范圍或者左右兩邊都不是 "\w" 范圍時的字符縫隙
*/
/----------------3.3------------------------------------------/
// 在表達(dá)式中有特殊意義,需要添加 "" 才能匹配該字符本身的字符匯總
/*
^ : 匹配輸入字符串的開始位置。要匹配 "^" 字符本身,請使用 "\^"
$ : 匹配輸入字符串的結(jié)尾位置。要匹配 "$" 字符本身,請使用 "\$"
( ) : 標(biāo)記一個子表達(dá)式的開始和結(jié)束位置。要匹配小括號,請使用 ""和"
"
[ ] : 用來自定義能夠匹配 '多種字符' 的表達(dá)式。要匹配中括號,請使用 ""和"
"
{ } : 修飾匹配次數(shù)的符號。要匹配大括號,請使用 "\{" 和 "\}"
. : 匹配除了換行符(\n)以外的任意一個字符。要匹配小數(shù)點本身,請使用 "\."
? : 修飾匹配次數(shù)為 0 次或 1 次。要匹配 "?" 字符本身,請使用 "\?"
+ : 修飾匹配次數(shù)為至少 1 次。要匹配 "+" 字符本身,請使用 "\+"
* : 修飾匹配次數(shù)為 0 次或任意次。要匹配 "*" 字符本身,請使用 "\*"
| : 左右兩邊表達(dá)式之間 "或" 關(guān)系。匹配 "|" 本身,請使用 "\|"
" : 用在不帶@的字符串中時,用\"來進(jìn)行轉(zhuǎn)義,用在帶@的字符串中時,用""來進(jìn)行轉(zhuǎn)義
** 注意:大部分在正則中有特殊意義、在匹配其本身時需轉(zhuǎn)義的字符,在[]內(nèi)是不需要轉(zhuǎn)義的。必須轉(zhuǎn)義的只有“\”、“[”和“]”,而“”出現(xiàn)在[]開始位置,“-”前后構(gòu)成范圍區(qū)間時,需要轉(zhuǎn)義,出現(xiàn)在其它位置不需要轉(zhuǎn)義,如:[ .$^{[(|)+?-]*
*/
}