JavaRegularExpr

Java 正則表達式和 Perl 的是最為相似的。

  1. 在其他語言中,\ 表示:我想要在正則表達式中插入一個普通的(字面上的)反斜杠,請不要給它任何特殊的意義。
    在 Java 中,\ 表示:我要插入一個正則表達式的反斜線,所以其后的字符具有特殊的意義。

  2. ^\d+(.\d+)?
    ^ 定義了以什么開始
    \d+ 匹配一個或多個數字
    ? 設置括號內的選項是可選的
    . 匹配 "."
    可以匹配的實例:"5", "1.5" 和 "2.21"。

  3. ^ 匹配輸入字符串開始的位置。

  4. $ 匹配輸入字符串結尾的位置。

    • 零次或多次匹配前面的字符或子表達式。例如,zo* 匹配"z"和"zoo"。* 等效于 {0,}。
    • 一次或多次匹配前面的字符或子表達式。例如,"zo+"與"zo"和"zoo"匹配,但與"z"不匹配。+ 等效于 {1,}。
  5. ? 零次或一次匹配前面的字符或子表達式。例如,"do(es)?"匹配"do"或"does"中的"do"。? 等效于 {0,1}。
    當此字符緊隨任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后時,匹配模式是"非貪心的"。"非貪心的"模式匹配搜索到的、盡可能短的字符串,而默認的"貪心的"模式匹配搜索到的、盡可能長的字符串。例如,在字符串"oooo"中,"o+?"只匹配單個"o",而"o+"匹配所有"o"。

  6. . 匹配除"\r\n"之外的任何單個字符。若要匹配包括"\r\n"在內的任意字符,請使用諸如"[\s\S]"之類的模式。

  7. (pattern) 匹配 pattern 并捕獲該匹配的子表達式。可使用m.group(index)獲取。

  8. {n} n 是非負整數。正好匹配 n 次。例如,"o{2}"與"Bob"中的"o"不匹配,但與"food"中的兩個"o"匹配。

  9. {n,} n 是非負整數。至少匹配 n 次。例如,"o{2,}"不匹配"Bob"中的"o",而匹配"foooood"中的所有 o。"o{1,}"等效于"o+"。"o{0,}"等效于"o*"。

  10. {n,m} m 和 n 是非負整數,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的頭三個 o。'o{0,1}' 等效于 'o?'。注意:您不能將空格插入逗號和數字之間。

  11. (?:pattern) 匹配 pattern 但不捕獲該匹配的子表達式,即它是一個非捕獲匹配,不存儲供以后使用的匹配。這對于用"or"字符 (|) 組合模式部件的情況很有用。例如,'industr(?:y|ies) 是比 'industry|industries' 更經濟的表達式。

  12. (?=pattern) 該表達式匹配處于匹配 pattern 的字符串的起始點的字符串。它是一個非捕獲匹配。例如,'Windows (?=95|98|NT|2000)' 匹配"Windows 2000"中的"Windows",但不匹配"Windows 3.1"中的"Windows"。

  13. (?!pattern) 該表達式匹配不處于匹配 pattern 的字符串的起始點的搜索字符串。它是一個非捕獲匹配。例如,'Windows (?!95|98|NT|2000)' 匹配"Windows 3.1"中的 "Windows",但不匹配"Windows 2000"中的"Windows"。

  14. x|y 匹配 x 或 y。例如,'z|food' 匹配"z"或"food"。'(z|f)ood' 匹配"zood"或"food"。

  15. [xyz] 字符集。匹配包含的任一字符。例如,"[abc]"匹配"plain"中的"a"。

  16. [^xyz] 反向字符集。匹配未包含的任何字符。例如,"[^abc]"匹配"plain"中"p","l","i","n"。

  17. [a-z] 字符范圍。匹配指定范圍內的任何字符。例如,"[a-z]"匹配"a"到"z"范圍內的任何小寫字母。

  18. [^a-z] 反向范圍字符。匹配不在指定的范圍內的任何字符。例如,"[^a-z]"匹配任何不在"a"到"z"范圍內的任何字符。

  19. \b 匹配一個字邊界,即字與空格間的位置。例如,"er\b"匹配"never"中的"er",但不匹配"verb"中的"er"。

  20. \B 非字邊界匹配。"er\B"匹配"verb"中的"er",但不匹配"never"中的"er"。

  21. \d 數字字符匹配。等效于 [0-9]。

  22. \D 非數字字符匹配。等效于 [^0-9]。

  23. \w 匹配任何字類字符,包括下劃線。與"[A-Za-z0-9_]"等效。

  24. \W 與任何非單詞字符匹配。與"[^A-Za-z0-9_]"等效。

  25. \f 換頁符匹配。等效于 \x0c 和 \cL。

  26. \n 換行符匹配。等效于 \x0a 和 \cJ。

  27. \s 匹配任何空白字符,包括空格、制表符、換頁符等。與 [ \f\n\r\t\v] 等效。

  28. \S 匹配任何非空白字符。與 [^ \f\n\r\t\v] 等效。

  29. \t 制表符匹配。與 \x09 和 \cI 等效。

  30. \v 垂直制表符匹配。與 \x0b 和 \cK 等效。

  31. \xn 匹配 n,此處的 n 是一個十六進制轉義碼。十六進制轉義碼必須正好是兩位數長。例如,"\x41"匹配"A"。"\x041"與"\x04"&"1"等效。允許在正則表達式中使用 ASCII 代碼。

  32. \un 匹配 n,其中 n 是以四位十六進制數表示的 Unicode 字符。例如,\u00A9 匹配版權符號 (?)。

  33. \num 匹配 num,此處的 num 是一個正整數。到捕獲匹配的反向引用。例如,"(.)\1"匹配兩個連續(xù)的相同字符。

  34. \n 標識一個八進制轉義碼或反向引用。如果 \n 前面至少有 n 個捕獲子表達式,那么 n 是反向引用。否則,如果 n 是八進制數 (0-7),那么 n 是八進制轉義碼。

  35. \nm 標識一個八進制轉義碼或反向引用。如果 \nm 前面至少有 nm 個捕獲子表達式,那么 nm 是反向引用。如果 \nm 前面至少有 n 個捕獲,則 n 是反向引用,后面跟有字符 m。如果兩種前面的情況都不存在,則 \nm 匹配八進制值 nm,其中 n 和 m 是八進制數字 (0-7)。

  36. \nml 當 n 是八進制數 (0-3),m 和 l 是八進制數 (0-7) 時,匹配八進制轉義碼 nml。

  37. \cx 匹配 x 指示的控制字符。例如,\cM 匹配 Control-M 或回車符。x 的值必須在 A-Z 或 a-z 之間。如果不是這樣,則假定 c 就是"c"字符本身。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • \ :將下一字符標記為特殊字符、文本、反向引用或八進制轉義符。例如,"n"匹配字符"n"。"\n"匹配換行符。序列...
    小沙鷹168閱讀 617評論 0 1
  • 正則表達式是一種文本模式,包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為“元字符”)。模式描述在搜索...
    Ten_Minutes閱讀 392評論 0 0
  • 在其他語言中,\\表示:我想要在正則表達式中插入一個普通的(字面上的)反斜杠,請不要給它任何特殊的意義。 在 Ja...
    Grail_Oosaki閱讀 586評論 0 0
  • 工作中經常要用到正則表達式,做個歸納總結,方便自己及有相同需求的人查閱。 1. 常用的文本框輸入內容控制表達式 2...
    程序猿KK閱讀 1,942評論 0 49
  • 在正則表達式上下文中的行為: 字符 說明 \ 將下一字符標記為特殊字符、文本、反向引用或八進制轉義符。例如,“...
    小po閱讀 409評論 2 3

友情鏈接更多精彩內容