[回憶篇]Javascript中正則表達(dá)式

轉(zhuǎn)自CSDN,5年前寫的第一篇技術(shù)類的文章,當(dāng)時(shí)還是個(gè)小菜鳥,一轉(zhuǎn)眼5年過去了

https://blog.csdn.net/webgeek/article/details/8617138

----------------------------------------------------------------------說正事分割線------------------------------------------------------------------------------------

javascript 正則表達(dá)式-貪婪模式與懶惰模式

前段時(shí)間對(duì)自己以前了解的正則表達(dá)式的基礎(chǔ)知識(shí)做了一個(gè)總結(jié),有了基礎(chǔ)知識(shí)已經(jīng)能夠能應(yīng)付大多數(shù)情況,像字符串匹配、正則替換、校驗(yàn)等;但是再使用的過程中你可能發(fā)現(xiàn)一個(gè)問題,就是當(dāng)使用重復(fù)元字符匹配數(shù)量時(shí),總是會(huì)盡可能長的去匹配,而有時(shí)這恰恰不是你想要的??聪旅娴睦樱?/p>

谷歌百度

你希望匹配出每個(gè)鏈接的html內(nèi)容。如果你用 會(huì)首先匹配到整個(gè)字符串,而不是你希望的谷歌百度

為什么會(huì)出現(xiàn)這種情況呢?這就是正則表達(dá)式的貪婪模式。當(dāng)出現(xiàn)重復(fù)數(shù)量的時(shí)候,會(huì)盡可能的多匹配。上述的正則表達(dá)式中 . 表示任意字符,* 代表可以重復(fù)出現(xiàn)任意個(gè),根據(jù)正則表達(dá)式的貪婪個(gè)性,不匹配到最后才怪呢。就像人一樣,有貪婪就有懶惰,一個(gè)?就可以讓正則立刻改變本性,這時(shí)的正則就表現(xiàn)懶惰模式的本性了。

修改后的正則表達(dá)式為:,這時(shí)就可以匹配出每個(gè)連接的html了。

測試用例為:

package org.buzheng.test;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class Test {

public static void main(String[] args) throws Exception {

String value = "谷歌百度";

System.out.println("貪婪模式:");

Pattern pattern = Pattern.compile("");

Matcher matcher = pattern.matcher(value);

while (matcher.find()) {

System.out.println(matcher.group(0));

}

System.out.println("貪婪模式:");

pattern = Pattern.compile("");

matcher = pattern.matcher(value);

while (matcher.find()) {

System.out.println(matcher.group(0));

}

}

}

最后總結(jié)一下數(shù)量元字符懶惰模式的常用寫法(其實(shí)就是多了一個(gè)?):

x*? 0個(gè)或者任意個(gè)x, 最少匹配

x?? 0個(gè)或這1個(gè)x, 最少匹配

x+? 至少1個(gè)x, 最少匹配

x{n,}? 至少n個(gè)x, 最少匹配

x{n,m}? 至少n個(gè)x,至多m個(gè)x, 最少匹配

--------------------------------------------------

javascript 正則表達(dá)式-零寬斷言

http://buzheng.org/blog/regex-zero-width-assertion/

正則表達(dá)式里面比較高級(jí)的應(yīng)用就屬于零寬斷言了。那么什么是零寬斷言呢?拆分法從字面上分析一下,零寬,即寬帶為0,意味者不會(huì)返回匹配的字符,以為匹配的是當(dāng)前字符的位置。斷言,就是預(yù)言、假設(shè),意味著從此處假設(shè)存在什么情況。那么零寬斷言的意思就是假定從此位置開始滿足某種情況。

根據(jù)斷言字符串位于當(dāng)前位置的前后關(guān)系,分為正向和反向斷言,根據(jù)斷言肯定和否定的語氣,又有正向否定斷言和反向否定斷言??隙磾嘌源嬖谠撟址?、否定即相反的意思:存在的不是該字符串,總之概念比較繞口,下表介紹的時(shí)候順便給出英文:

(?=X) 正向斷言,假定該位置后跟的是X

zero-width positive lookahead

(?!X) 正向否定斷言,假設(shè)該位置后跟的不是X

zero-width negative lookahead

(?<=X) 反向斷言,假設(shè)該位置前跟的是X

zero-width positive lookbehind

(?

zero-width negative lookbehind

舉例:

(?=X) 正向斷言

[^s]+?(?=ing) 來匹配 having doing listing,會(huì)匹配出 hav, do, list,注意:并不會(huì)匹配出ing,因?yàn)閕ng是零寬斷言的部分。

(?!X) 正向否定斷言

一個(gè)用戶注冊(cè)功能的密碼有如下要求:由數(shù)字和字母組成,并且要同時(shí)含有數(shù)字和字母,且長度要在8-16位之間。

如何分析需求?拆分!這就是軟件設(shè)計(jì)的一般思路了。于是乎,拆分需求如下:

1,不能全部是數(shù)字

2,不能全部是字母

3,必須是數(shù)字或字母

只要能同時(shí)滿足上面3個(gè)要求就可以了,寫出來如下:

^(?![0-9]+$)(?![a-zA-Z]+$)[0-9A-Za-z]{8,16}$

分開來注釋一下:

^ 匹配一行的開頭位置

(?![0-9]+$) 預(yù)測該位置后面不全是數(shù)字

(?![a-zA-Z]+$) 預(yù)測該位置后面不全是字母

[0-9A-Za-z] {8,16} 由8-16位數(shù)字或這字母組成

$ 匹配行結(jié)尾位置

(?<=X) 反向斷言

(?<=hell)[a-z]+ 來匹配test hellen hellas helloween,會(huì)匹配出 en, as, oween

(?

[a-z]+(?

注:所有的案例都在UE下進(jìn)行測試。

----------------------------------------------------------------

javascript中的遞歸

遞歸做為一種算法在程序設(shè)計(jì)語言中廣泛應(yīng)用.是指函數(shù)/過程/子程序在運(yùn)行過程中直接或間接調(diào)用自身而產(chǎn)生的重入現(xiàn)象.遞歸是計(jì)算機(jī)科學(xué)的一個(gè)重要概念,遞歸的方法是程序設(shè)計(jì)中有效的方法,采用遞歸編寫程序能使程序變得簡潔和清晰.。

遞歸函數(shù):把直接或間接地調(diào)用自身的函數(shù)稱為遞歸函數(shù)。函數(shù)的構(gòu)建通常需要一個(gè)函數(shù)或者一個(gè)過程來完成。在數(shù)學(xué)上,關(guān)于遞歸函數(shù)的定義如下:對(duì)于某一函數(shù)f(x),其定義域是集合A,那么若對(duì)于A集合中的某一個(gè)值X0,其函數(shù)值f(x0)由f(f(x0))決定,那么就稱f(x)為遞歸函數(shù)。

遞歸函數(shù)是在一個(gè)函數(shù)通過調(diào)用自身的情況下去解決的。方式如下:

JavaScript代碼

function factorial(num)

{

if(num <= 1)

{

return 1;

}

else

{

return num*factorial(num-1);

}

}

但是這在js里面可能會(huì)出現(xiàn)錯(cuò)誤:

JavaScript代碼

var anotherFactorial = factorial;

factorial=null;

alert(anoterFactorial(4));

因?yàn)樵谡{(diào)用anoterFactorial時(shí)內(nèi)部的factorial已經(jīng)不存在了。

解決方法是通過arguments.callee來解決。

如下:

JavaScript代碼

function factorial(num)

{

if(num <= 1)

{

return 1;

}

else

{

return num*arguments.callee(num-1);

}

var anotherFactorial = factorial;

factorial = null;

alert(anotherFactorial(4));

}

如果在一個(gè)很復(fù)雜的程序中我們可能只需要調(diào)用一次該函數(shù),為了函數(shù)的精簡我們當(dāng)然要努力較少函數(shù)名的定義,這是很自然會(huì)想到用匿名函數(shù)來直接執(zhí)行。但是如果是匿名函數(shù)如何實(shí)現(xiàn)遞歸?arguments.callee正好派上用場,他指代的就是當(dāng)前執(zhí)行的函數(shù)的引用。

arguments.callee

在 javascript函數(shù)體內(nèi),標(biāo)識(shí)符arguments具有特殊含義。它是調(diào)用對(duì)象的一個(gè)特殊屬性,用來引用Arguments對(duì)象。 Arugments對(duì)象就像數(shù)組,注意這里只是像并不是哈。javascript函數(shù)體內(nèi),arguments像數(shù)組(并不是真的數(shù)組,是一個(gè) Arguments對(duì)象,再次強(qiáng)調(diào))一樣,有l(wèi)ength屬性,可以代 表傳給函數(shù)的參數(shù)的個(gè)數(shù)。

引用一個(gè)形式參數(shù)可以用參數(shù)名,也可以用arguments[]數(shù)組形式,其中arguments[0]表示第一個(gè)參數(shù)。所以,javascript中Arguments對(duì)象是函數(shù)的實(shí)際參數(shù),下面,我們一起來進(jìn)入這神奇的國度,一窺究竟。

arguments.length屬性:js不會(huì)主動(dòng)為你判斷你到底給函數(shù)傳了多少個(gè)參數(shù),如果你多傳了,多余的部分就沒有被使用,如果你少傳了,那么沒傳的參數(shù)值就是undefined

所以我們可以借助arguments的length屬性來檢測調(diào)用函數(shù)時(shí)是否使用了正確數(shù)目的實(shí)際參數(shù),因?yàn)閖avascript是不會(huì)為你做這些事的。

JavaScript代碼

function f(x,y,z)

{

//首先檢查傳遞的參數(shù)數(shù)量是否正確

if(arguments.length != 3)

{

throw new Error("function f called with " + arguments.length + "arguments ,but it not 3 arguments.");

}

//下面運(yùn)行真正的函數(shù)

}

arguments還為我們提供了這樣一種可能,就是為一個(gè)函數(shù)傳任意數(shù)目的實(shí)際參數(shù):比如說,我想判斷你傳給我的一些數(shù)字的大小,取出最大的那個(gè),對(duì),沒錯(cuò),你傳多少參數(shù)都行,但是前提是你要傳數(shù)字,因?yàn)槲以诤瘮?shù)內(nèi)部懶得判斷了。

JavaScript代碼

function max()

{

var m = Number.NEGATIVE_INFINITY;//Number.NEGATIVE_INFINITY JavaScript內(nèi)最小的數(shù)字了

for(var i = 0; i < arguments.length; i++)

{

//只要有任何一個(gè)參數(shù)比m大,那么m就變成了這個(gè)參數(shù)的值

if(arguments[i] > m)

m = arguments[i];

}

return m;

}

怎么樣?這個(gè)方法很巧妙吧?

說明一下arguments與真正傳的形式參數(shù)是一致的:比如,你給函數(shù)傳了一個(gè)叫param的參數(shù),并且只有這一個(gè)參數(shù),那么param與arguments[0]都是對(duì)這個(gè)參數(shù)值的引用,改變其中一個(gè)值,即改變了二者所有的值。

JavaScript代碼

function change(param)

{

//比如我傳的param為simaopig,那么alert就是simaopig,

//如果啥也沒傳就會(huì)alert undefined

alert(param);

//用arguments[0]改變了這個(gè)參數(shù)的值

arguments[0] = 'xiaoxiaozi';

//沒錯(cuò),這個(gè)值變成了xiaoxiaozi

alert(param);

}

arguments的callee屬性:arguments的callee屬性是用來引用當(dāng)前正在執(zhí)行的函數(shù),這對(duì)未命名的函數(shù)調(diào)用自身非常有好處。

現(xiàn)在用arguments的這個(gè)callee簡單的實(shí)現(xiàn)。

JavaScript代碼

//用函數(shù)直接量,采用 arguments.callee屬性實(shí)現(xiàn)遞歸函數(shù)

var result = function(x){

if(x<=1) return 1;

return x*arguments.callee(x-1);

};

在最后提醒大家一點(diǎn),既然這個(gè)arguments這么厲害,那么我們就不要為變量命名為arguments 了,事實(shí)上arguments是javascript的保留字之一。

-----------------------------------------------------------

常用的JavaScript驗(yàn)證正則表達(dá)式

匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]

評(píng)注:匹配中文還真是個(gè)頭疼的事,有了這個(gè)表達(dá)式就好辦了

匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]

評(píng)注:可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)

匹配空白行的正則表達(dá)式:ns*r

評(píng)注:可以用來刪除空白行

匹配HTML標(biāo)記的正則表達(dá)式:< (S*?)[^>]*>.*?|< .*? />

評(píng)注:網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能匹配部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無能為力

匹配首尾空白字符的正則表達(dá)式:^s*|s*$

評(píng)注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式

匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

評(píng)注:表單驗(yàn)證時(shí)很實(shí)用

匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^s]*

評(píng)注:網(wǎng)上流傳的版本功能很有限,上面這個(gè)基本可以滿足需求

匹配帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

評(píng)注:表單驗(yàn)證時(shí)很實(shí)用

匹配國內(nèi)電話號(hào)碼:d{3}-d{8}|d{4}-d{7}

評(píng)注:匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號(hào):[1-9][0-9]{4,}

評(píng)注:騰訊QQ號(hào)從10000開始

匹配中國郵政編碼:[1-9]d{5}(?!d)

評(píng)注:中國郵政編碼為6位數(shù)字

匹配身份證:d{15}|d{18}

評(píng)注:中國的身份證為15位或18位

匹配ip地址:d+.d+.d+.d+

評(píng)注:提取ip地址時(shí)有用

匹配特定數(shù)字:

^[1-9]d*$    //匹配正整數(shù)

^-[1-9]d*$   //匹配負(fù)整數(shù)

^-?[1-9]d*$   //匹配整數(shù)

^[1-9]d*|0$  //匹配非負(fù)整數(shù)(正整數(shù) + 0)

^-[1-9]d*|0$   //匹配非正整數(shù)(負(fù)整數(shù) + 0)

^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮點(diǎn)數(shù)

^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配負(fù)浮點(diǎn)數(shù)

^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮點(diǎn)數(shù)

^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)

^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)

評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正

匹配特定字符串:

^[A-Za-z]+$  //匹配由26個(gè)英文字母組成的字符串

^[A-Z]+$  //匹配由26個(gè)英文字母的大寫組成的字符串

^[a-z]+$  //匹配由26個(gè)英文字母的小寫組成的字符串

^[A-Za-z0-9]+$  //匹配由數(shù)字和26個(gè)英文字母組成的字符串

^w+$  //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串

在使用RegularExpressionValidator驗(yàn)證控件時(shí)的驗(yàn)證功能及其驗(yàn)證表達(dá)式介紹如下:

只能輸入數(shù)字:“^[0-9]*$”

只能輸入n位的數(shù)字:“^d{n}$”

只能輸入至少n位數(shù)字:“^d{n,}$”

只能輸入m-n位的數(shù)字:“^d{m,n}$”

只能輸入零和非零開頭的數(shù)字:“^(0|[1-9][0-9]*)$”

只能輸入有兩位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{2})?$”

只能輸入有1-3位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{1,3})?$”

只能輸入非零的正整數(shù):“^+?[1-9][0-9]*$”

只能輸入非零的負(fù)整數(shù):“^-[1-9][0-9]*$”

只能輸入長度為3的字符:“^.{3}$”

只能輸入由26個(gè)英文字母組成的字符串:“^[A-Za-z]+$”

只能輸入由26個(gè)大寫英文字母組成的字符串:“^[A-Z]+$”

只能輸入由26個(gè)小寫英文字母組成的字符串:“^[a-z]+$”

只能輸入由數(shù)字和26個(gè)英文字母組成的字符串:“^[A-Za-z0-9]+$”

只能輸入由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:“^w+$”

驗(yàn)證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間,

只能包含字符、數(shù)字和下劃線。

驗(yàn)證是否含有^%&’,;=?$”等字符:“[^%&',;=?$x22]+”

只能輸入漢字:“^[u4e00-u9fa5],{0,}$”

驗(yàn)證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”

驗(yàn)證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”

驗(yàn)證電話號(hào)碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”

正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,

“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。

驗(yàn)證身份證號(hào)(15位或18位數(shù)字):“^d{15}|d{}18$”

驗(yàn)證一年的12個(gè)月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”

驗(yàn)證一個(gè)月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”

正確格式為:“01”“09”和“1”“31”。

匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]

匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]

匹配空行的正則表達(dá)式:n[s| ]*r

匹配HTML標(biāo)記的正則表達(dá)式:/< (.*)>.*|< (.*) />/

匹配首尾空格的正則表達(dá)式:(^s*)|(s*$)

匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配網(wǎng)址URL的正則表達(dá)式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

(1)應(yīng)用:計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)

String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}

(2)應(yīng)用:javascript中沒有像vbscript那樣的trim函數(shù),我們就可以利用這個(gè)表達(dá)式來實(shí)現(xiàn)

String.prototype.trim = function()

{

return this.replace(/(^s*)|(s*$)/g, “”);

}

(3)應(yīng)用:利用正則表達(dá)式分解和轉(zhuǎn)換IP地址

function IP2V(ip) //IP地址轉(zhuǎn)換成對(duì)應(yīng)數(shù)值

{

re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達(dá)式

if(re.test(ip))

{

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1

}

else

{

throw new Error(”Not a valid IP address!”)

}

}

(4)應(yīng)用:從URL地址中提取文件名的javascript程序

s=”http://www.9499.net/page1.htm”;

s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm

(5)應(yīng)用:利用正則表達(dá)式限制網(wǎng)頁表單里的文本框輸入內(nèi)容

用 正則表達(dá)式限制只能輸入中文:onkeyup=”value=”/blog/value.replace(/["^u4E00-u9FA5]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^u4E00-u9FA5]/g,”))”

用 正則表達(dá)式限制只能輸入全角字符: onkeyup=”value=”/blog/value.replace(/["^uFF00-uFFFF]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^uFF00-uFFFF]/g,”))”

用 正則表達(dá)式限制只能輸入數(shù)字:onkeyup=”value=”/blog/value.replace(/["^d]/g,”) “onbeforepaste= “clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”))”

用 正則表達(dá)式限制只能輸入數(shù)字和英文:onkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容