正則表達式判斷手機號和郵箱

在程序開發(fā)中,我們會遇到注冊賬號的情況。對于賬號我們會約定一些規(guī)則,比如說手機號碼是11位的數(shù)字,郵箱只能由26個字母和數(shù)字及幾個特殊的字符組成。那我們怎么判斷用戶輸入的賬號和郵箱是不是符合我們的規(guī)則?你可能會說,我可以寫一段程序來判斷呀!沒錯,但是,有沒有更好的解決方法。當然是有的,正則表達式就是來做這個事情的。

什么是正則表達式?

正則表達式--是用于描述符合某些復雜規(guī)則的字符串的表達式,簡單講就是記錄文本規(guī)則的代碼。

基本語法

學習正則表達式的最好方法是從例子開始,理解例子之后再自己對例子進行修改,實驗。
例如,在一篇文檔里面查找hi,可以直接查找hi(你也是這樣做的,哈哈),不幸的是,很多單詞包含hi這兩個連續(xù)的字符,比如him,history,這顯然不是我們需要的結果,我就只要hi這個單詞,要怎么做?答案是使用\bhi\b


下面的符號都叫做元字符(metacharacter),也就是正則表達式規(guī)定好的特殊代碼

  • \b 匹配單詞的開頭和結尾,也就是單詞的分界處
  • . 匹配除換行符號以外的任意字符
  • \w 匹配字母或數(shù)字或下劃線或漢字
  • \s 匹配任意的空白符
  • \d 匹配數(shù)字(0到9)
  • ^ 匹配字符串的開始
  • $ 匹配字符串的結束
    例如:
    0\d\d-\d\d\d\d\d\d\d\d匹配這樣的字符串:以0開頭,然后是兩個數(shù)字,然后是一個連字號“-”,最后是8個數(shù)字(也就是中國的電話號碼。當然,這個例子只能匹配區(qū)號為3位的情形)。
    這里的\d是個元字符,匹配數(shù)字。"-"不是元字符,只匹配它本身——連字符(或者減號,或者中橫線,或者隨你怎么稱呼它)。
    為了避免那么多煩人的重復,我們也可以這樣寫這個表達式:0\d{2}-\d{8}。這里\d后面的{2}({8})的意思是前面\d必須連續(xù)重復匹配2次(8次)。
    元字符(和數(shù)字6在同一個鍵位上的符號)和$都匹配一個位置,這和\b有點類似。匹配你要用來查找的字符串的開頭,$匹配結尾。這兩個代碼在驗證輸入的內容時非常有用,比如一個網(wǎng)站如果要求你填寫的QQ號必須為5位到12位數(shù)字時,可以使用:^\d{5,12}$
    這里的{5,12}和前面介紹過的{2}是類似的,只不過{2}匹配只能不多不少重復2次,{5,12}則是重復的次數(shù)不能少于5次,不能多于12次,否則都不匹配。
    因為使用了^和$,所以輸入的整個字符串都要用來和\d{5,12}來匹配,也就是說整個輸入必須是5到12個數(shù)字,因此如果輸入的QQ號能匹配這個正則表達式的話,那就符合要求了。

字符轉義

如果你想查找元字符本身的話,比如你查找.,或者*,就出現(xiàn)了問題:你沒辦法指定它們,因為它們會被解釋成別的意思。這時你就得使用\來取消這些字符的特殊意義。因此,你應該使用.和*。當然,要查找\本身,你也得用\.
例如:iOS\.com匹配iOS.com,C:\\\Windows匹配C:\Windows

重復

  • *重復0次或更多次
  • +重復1次或更多次
  • ?重復0次或1次
  • {n}重復n次
  • {n,}重復n次或更多次
  • {n,m}重復n到m次

字符類

要想查找數(shù)字,字母或數(shù)字,空白是很簡單的,因為已經(jīng)有了對應這些字符集合的元字符,但是如果你想匹配沒有預定義元字符的字符集合(比如元音字母a,e,i,o,u),應該怎么辦?
很簡單,你只需要在方括號里列出它們就行了,像[aeiou]就匹配任何一個英文元音字母,[.?!]匹配標點符號(.或?或!)。
我們也可以輕松地指定一個字符范圍,像[0-9]代表的含意與\d就是完全一致的:一位數(shù)字;同理[a-z0-9A-Z_]也完全等同于\w(如果只考慮英文的話)。
下面是一個更復雜的表達式:\(?0\d{2}[) -]?\d{8}
“(”“)”也是元字符,后面的分組節(jié)里會提到,所以在這里需要使用轉義。
這個表達式可以匹配幾種格式的電話號碼,像(010)88886666,或022-22334455,或02912345678等。我們對它進行一些分析吧:首先是一個轉義字符(,它能出現(xiàn)0次或1次(?),然后是一個0,后面跟著2個數(shù)字(\d{2}),然后是)或-或空格中的一個,它出現(xiàn)1次或不出現(xiàn)(?),最后是8個數(shù)字(\d{8})。

分歧條件

不幸的是,剛才那個表達式也能匹配010)12345678或(022-87654321這樣的“不正確”的格式。要解決這個問題,我們需要用到分枝條件。正則表達式里的分枝條件指的是有幾種規(guī)則,如果滿足其中任意一種規(guī)則都應該當成匹配,具體方法是用|把不同的規(guī)則分隔開。聽不明白?沒關系,看例子:
0\d{2}-\d{8}|0\d{3}-\d{7}這個表達式能匹配兩種以連字號分隔的電話號碼:一種是三位區(qū)號,8位本地號(如010-12345678),一種是4位區(qū)號,7位本地號(0376-2233445)。
(?0\d{2})?[- ]?\d{8}|0\d{2}[- ]?\d{8}這個表達式匹配3位區(qū)號的電話號碼,其中區(qū)號可以用小括號括起來,也可以不用,區(qū)號與本地號間可以用連字號或空格間隔,也可以沒有間隔。你可以試試用分枝條件把這個表達式擴展成也支持4位區(qū)號的。
\d{5}-\d{4}|\d{5}這個表達式用于匹配美國的郵政編碼。美國郵編的規(guī)則是5位數(shù)字,或者用連字號間隔的9位數(shù)字。之所以要給出這個例子是因為它能說明一個問題:使用分枝條件時,要注意各個條件的順序。如果你把它改成\d{5}|\d{5}-\d{4}的話,那么就只會匹配5位的郵編(以及9位郵編的前5位)。原因是匹配分枝條件時,將會從左到右地測試每個條件,如果滿足了某個分枝的話,就不會去再管其它的條件了。

反義

有時需要查找不屬于某個能簡單定義的字符類的字符。比如想查找除了數(shù)字以外,其它任意字符都行的情況,這時需要用到反義:

  • \W 匹配任意不是字母,數(shù)字,下劃線,漢字的字符
  • \S 匹配任意不是空白符的字符
  • \D 匹配任意非數(shù)字的字符
  • \B 匹配不是單詞開頭或結束的位置
  • [^x] 匹配除了x以外的任意字符
  • [^aeiou] 匹配除了aeiou這幾個字母以外的任意字符
    例子:\S+匹配不包含空白符的字符串。
    <a[^>]+>匹配用尖括號括起來的以a開頭的字符串。
    更多請參考正則表達式本文大部分內容來自上面鏈接,這些基本能滿足平常運用。我們寫的正則表達式對不對可以驗證一下在線正則表達式驗證

實際運用

上面啰嗦了這么多,我們的目的是要運用,下面給出iOS中驗證手機和郵箱的例子。
//手機號碼驗證
+ (BOOL)isValidateMobile:(NSString *)mobile
{
NSString *phoneRegex = @"^1[3|4|5|7|8][0-9]{9}$";
NSPredicate *predicatePhone = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",phoneRegex];
return [predicatePhone evaluateWithObject:mobile];
}
//因為三大運營商不斷有新號段出來,驗證規(guī)則可能不完美
//NSPredicate是謂詞,相當于刷選的功能,具體可以看其他文檔

//利用正則表達式驗證郵箱
  + (BOOL)isValidateEmail:(NSString *)email 
  {
    NSString *emailRegex = @"[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?";   
    NSPredicate *predicateEmail = [NSPredicate predicateWithFormat:emailRegex];
   return [predicateEmail evaluateWithObject:email];   
  }
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 正則表達式到底是什么東西?字符是計算機軟件處理文字時最基本的單位,可能是字母,數(shù)字,標點符號,空格,換行符,漢字等...
    獅子挽歌閱讀 2,277評論 0 9
  • 初衷:看了很多視頻、文章,最后卻通通忘記了,別人的知識依舊是別人的,自己卻什么都沒獲得。此系列文章旨在加深自己的印...
    DCbryant閱讀 4,243評論 0 20
  • 注:本篇文章只為方便查看,特此保留,如有冒犯,敬請諒解!??! 本文目標 30分鐘內讓你明白正則表達式是什么,并對它...
    阿杰Alex閱讀 1,562評論 0 10
  • 推薦幾個正則表達式編輯器 Debuggex :https://www.debuggex.com/ PyRegex:...
    木易林1閱讀 11,845評論 9 151
  • 幾個正則表達式編輯器 Debuggex :https://www.debuggex.com/ PyRegex:ht...
    沒技術的BUG開發(fā)攻城獅閱讀 4,683評論 0 23

友情鏈接更多精彩內容