正則表達(dá)式集合

一、簡介

?1、作用

在編寫處理字符串的程序或網(wǎng)頁時(shí),經(jīng)常會(huì)有查找符合某些復(fù)雜規(guī)則的字符串的需要。 正則表達(dá)式就是用于描述這些規(guī)則的工具。換句話說,正則表達(dá)式就是記錄文本規(guī)則的代碼。正則表達(dá)式(regular expression)描述了一種字符串匹配的模式,可以用來檢查一個(gè)串是否含有某種子串、將匹配的子串做替換或者從某個(gè)串中取出符合某個(gè)條件的子串等。

2、java中使用

a、匹配

String text? ? ="This is the text to be searched "+"for occurrences of the http:// pattern.";

String patternString =".*http://.*";

Pattern pattern = Pattern.compile(patternString);

Matcher matcher = pattern.matcher(text);

boolean matches = matcher.matches();

b、檢索

String text? ? ="This is the text which is to be searched "+"for occurrences of the word 'is'.";

String patternString ="is";

Pattern pattern =Pattern.compile(patternString);

Matcher matcher = pattern.matcher(text);

int count=0;

while(matcher.find()) {

count++;

System.out.println("found: "+count+" : "+ matcher.start() +" - "+ matcher.end());

}

二、常見正則表達(dá)式集合

1、校驗(yàn)數(shù)字的表達(dá)式

數(shù)字:^[0-9]*$

n位的數(shù)字:^\d{n}$

至少n位的數(shù)字:^\d{n,}$

m-n位的數(shù)字:^\d{m,n}$

零和非零開頭的數(shù)字:^(0|[1-9][0-9]*)$

非零開頭的最多帶兩位小數(shù)的數(shù)字:^([1-9][0-9]*)+(.[0-9]{1,2})?$

帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):^(\-)?\d+(\.\d{1,2})?$

正數(shù)、負(fù)數(shù)、和小數(shù):^(\-|\+)?\d+(\.\d+)?$

有兩位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{2})?$

有1~3位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{1,3})?$

非零的正整數(shù):^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$

非零的負(fù)整數(shù):^\-[1-9][]0-9″*$ 或 ^-[1-9]\d*$

非負(fù)整數(shù):^\d+$ 或 ^[1-9]\d*|0$

非正整數(shù):^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$

非負(fù)浮點(diǎn)數(shù):^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

非正浮點(diǎn)數(shù):^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

正浮點(diǎn)數(shù):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

負(fù)浮點(diǎn)數(shù):^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮點(diǎn)數(shù):^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

2、校驗(yàn)字符的表達(dá)式

漢字:^[\u4e00-\u9fa5]{0,}$

英文和數(shù)字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

長度為3-20的所有字符:^.{3,20}$

由26個(gè)英文字母組成的字符串:^[A-Za-z]+$

由26個(gè)大寫英文字母組成的字符串:^[A-Z]+$

由26個(gè)小寫英文字母組成的字符串:^[a-z]+$

由數(shù)字和26個(gè)英文字母組成的字符串:^[A-Za-z0-9]+$

由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$

中文、英文、數(shù)字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$

中文、英文、數(shù)字但不包括下劃線等符號(hào):^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$

可以輸入含有^%&',;=?$\”等字符:[^%&',;=?$\x22]+

禁止輸入含有~的字符:[^~\x22]+

三、常用實(shí)例

Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

手機(jī)號(hào)碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

電話號(hào)碼(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^($$\d{3,4}-)|\d{3.4}-)?\d{7,8}$

國內(nèi)電話號(hào)碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}

身份證號(hào)(15位、18位數(shù)字):^\d{15}|\d{18}$

短身份證號(hào)碼(數(shù)字、字母x結(jié)尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$

帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

密碼(以字母開頭,長度在6~18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]\w{5,17}$

強(qiáng)密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

日期格式:^\d{4}-\d{1,2}-\d{1,2}

一年的12個(gè)月(01~09和1~12):^(0?[1-9]|1[0-2])$

一個(gè)月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$

中文字符的正則表達(dá)式:[\u4e00-\u9fa5]

雙字節(jié)字符:[^\x00-\xff] (包括漢字在內(nèi),可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1))

空白行的正則表達(dá)式:\n\s*\r (可以用來刪除空白行)

HTML標(biāo)記的正則表達(dá)式:<(\S*?)[^>]*>.*?|<.*? /> (網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能部分,對于復(fù)雜的嵌套標(biāo)記依舊無能為力)

首尾空白字符的正則表達(dá)式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式)

騰訊QQ號(hào):[1-9][0-9]{4,} (騰訊QQ號(hào)從10000開始)

中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數(shù)字)

IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址時(shí)有用)

IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

Android中使用推薦使用一個(gè)工具類,例如這個(gè)開源庫?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容