轉(zhuǎn)自CSDN,5年前寫的第一篇技術(shù)類的文章,當(dāng)時(shí)還是個(gè)小菜鳥,一轉(zhuǎn)眼5年過去了
https://blog.csdn.net/webgeek/article/details/8617138
----------------------------------------------------------------------說正事分割線------------------------------------------------------------------------------------
javascript 正則表達(dá)式-貪婪模式與懶惰模式
前段時(shí)間對(duì)自己以前了解的正則表達(dá)式的基礎(chǔ)知識(shí)做了一個(gè)總結(jié),有了基礎(chǔ)知識(shí)已經(jīng)能夠能應(yīng)付大多數(shù)情況,像字符串匹配、正則替換、校驗(yàn)等;但是再使用的過程中你可能發(fā)現(xiàn)一個(gè)問題,就是當(dāng)使用重復(fù)元字符匹配數(shù)量時(shí),總是會(huì)盡可能長的去匹配,而有時(shí)這恰恰不是你想要的??聪旅娴睦樱?/p>
你希望匹配出每個(gè)鏈接的html內(nèi)容。如果你用 會(huì)首先匹配到整個(gè)字符串,而不是你希望的谷歌和百度。
為什么會(huì)出現(xiàn)這種情況呢?這就是正則表達(dá)式的貪婪模式。當(dāng)出現(xiàn)重復(fù)數(shù)量的時(shí)候,會(huì)盡可能的多匹配。上述的正則表達(dá)式中 . 表示任意字符,* 代表可以重復(fù)出現(xiàn)任意個(gè),根據(jù)正則表達(dá)式的貪婪個(gè)性,不匹配到最后才怪呢。就像人一樣,有貪婪就有懶惰,一個(gè)?就可以讓正則立刻改變本性,這時(shí)的正則就表現(xiàn)懶惰模式的本性了。
修改后的正則表達(dá)式為:,這時(shí)就可以匹配出每個(gè)連接的html了。
測試用例為:
package org.buzheng.test;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) throws Exception {
System.out.println("貪婪模式:");
Pattern pattern = Pattern.compile("");
Matcher matcher = pattern.matcher(value);
while (matcher.find()) {
System.out.println(matcher.group(0));
}
System.out.println("貪婪模式:");
pattern = Pattern.compile("");
matcher = pattern.matcher(value);
while (matcher.find()) {
System.out.println(matcher.group(0));
}
}
}
最后總結(jié)一下數(shù)量元字符懶惰模式的常用寫法(其實(shí)就是多了一個(gè)?):
x*? 0個(gè)或者任意個(gè)x, 最少匹配
x?? 0個(gè)或這1個(gè)x, 最少匹配
x+? 至少1個(gè)x, 最少匹配
x{n,}? 至少n個(gè)x, 最少匹配
x{n,m}? 至少n個(gè)x,至多m個(gè)x, 最少匹配
--------------------------------------------------
javascript 正則表達(dá)式-零寬斷言
http://buzheng.org/blog/regex-zero-width-assertion/
正則表達(dá)式里面比較高級(jí)的應(yīng)用就屬于零寬斷言了。那么什么是零寬斷言呢?拆分法從字面上分析一下,零寬,即寬帶為0,意味者不會(huì)返回匹配的字符,以為匹配的是當(dāng)前字符的位置。斷言,就是預(yù)言、假設(shè),意味著從此處假設(shè)存在什么情況。那么零寬斷言的意思就是假定從此位置開始滿足某種情況。
根據(jù)斷言字符串位于當(dāng)前位置的前后關(guān)系,分為正向和反向斷言,根據(jù)斷言肯定和否定的語氣,又有正向否定斷言和反向否定斷言??隙磾嘌源嬖谠撟址?、否定即相反的意思:存在的不是該字符串,總之概念比較繞口,下表介紹的時(shí)候順便給出英文:
(?=X) 正向斷言,假定該位置后跟的是X
zero-width positive lookahead
(?!X) 正向否定斷言,假設(shè)該位置后跟的不是X
zero-width negative lookahead
(?<=X) 反向斷言,假設(shè)該位置前跟的是X
zero-width positive lookbehind
(?
zero-width negative lookbehind
舉例:
(?=X) 正向斷言
[^s]+?(?=ing) 來匹配 having doing listing,會(huì)匹配出 hav, do, list,注意:并不會(huì)匹配出ing,因?yàn)閕ng是零寬斷言的部分。
(?!X) 正向否定斷言
一個(gè)用戶注冊(cè)功能的密碼有如下要求:由數(shù)字和字母組成,并且要同時(shí)含有數(shù)字和字母,且長度要在8-16位之間。
如何分析需求?拆分!這就是軟件設(shè)計(jì)的一般思路了。于是乎,拆分需求如下:
1,不能全部是數(shù)字
2,不能全部是字母
3,必須是數(shù)字或字母
只要能同時(shí)滿足上面3個(gè)要求就可以了,寫出來如下:
^(?![0-9]+$)(?![a-zA-Z]+$)[0-9A-Za-z]{8,16}$
分開來注釋一下:
^ 匹配一行的開頭位置
(?![0-9]+$) 預(yù)測該位置后面不全是數(shù)字
(?![a-zA-Z]+$) 預(yù)測該位置后面不全是字母
[0-9A-Za-z] {8,16} 由8-16位數(shù)字或這字母組成
$ 匹配行結(jié)尾位置
(?<=X) 反向斷言
(?<=hell)[a-z]+ 來匹配test hellen hellas helloween,會(huì)匹配出 en, as, oween
(?
[a-z]+(?
注:所有的案例都在UE下進(jìn)行測試。
----------------------------------------------------------------
javascript中的遞歸
遞歸做為一種算法在程序設(shè)計(jì)語言中廣泛應(yīng)用.是指函數(shù)/過程/子程序在運(yùn)行過程中直接或間接調(diào)用自身而產(chǎn)生的重入現(xiàn)象.遞歸是計(jì)算機(jī)科學(xué)的一個(gè)重要概念,遞歸的方法是程序設(shè)計(jì)中有效的方法,采用遞歸編寫程序能使程序變得簡潔和清晰.。
遞歸函數(shù):把直接或間接地調(diào)用自身的函數(shù)稱為遞歸函數(shù)。函數(shù)的構(gòu)建通常需要一個(gè)函數(shù)或者一個(gè)過程來完成。在數(shù)學(xué)上,關(guān)于遞歸函數(shù)的定義如下:對(duì)于某一函數(shù)f(x),其定義域是集合A,那么若對(duì)于A集合中的某一個(gè)值X0,其函數(shù)值f(x0)由f(f(x0))決定,那么就稱f(x)為遞歸函數(shù)。
遞歸函數(shù)是在一個(gè)函數(shù)通過調(diào)用自身的情況下去解決的。方式如下:
JavaScript代碼
function factorial(num)
{
if(num <= 1)
{
return 1;
}
else
{
return num*factorial(num-1);
}
}
但是這在js里面可能會(huì)出現(xiàn)錯(cuò)誤:
JavaScript代碼
var anotherFactorial = factorial;
factorial=null;
alert(anoterFactorial(4));
因?yàn)樵谡{(diào)用anoterFactorial時(shí)內(nèi)部的factorial已經(jīng)不存在了。
解決方法是通過arguments.callee來解決。
如下:
JavaScript代碼
function factorial(num)
{
if(num <= 1)
{
return 1;
}
else
{
return num*arguments.callee(num-1);
}
var anotherFactorial = factorial;
factorial = null;
alert(anotherFactorial(4));
}
如果在一個(gè)很復(fù)雜的程序中我們可能只需要調(diào)用一次該函數(shù),為了函數(shù)的精簡我們當(dāng)然要努力較少函數(shù)名的定義,這是很自然會(huì)想到用匿名函數(shù)來直接執(zhí)行。但是如果是匿名函數(shù)如何實(shí)現(xiàn)遞歸?arguments.callee正好派上用場,他指代的就是當(dāng)前執(zhí)行的函數(shù)的引用。
arguments.callee
在 javascript函數(shù)體內(nèi),標(biāo)識(shí)符arguments具有特殊含義。它是調(diào)用對(duì)象的一個(gè)特殊屬性,用來引用Arguments對(duì)象。 Arugments對(duì)象就像數(shù)組,注意這里只是像并不是哈。javascript函數(shù)體內(nèi),arguments像數(shù)組(并不是真的數(shù)組,是一個(gè) Arguments對(duì)象,再次強(qiáng)調(diào))一樣,有l(wèi)ength屬性,可以代 表傳給函數(shù)的參數(shù)的個(gè)數(shù)。
引用一個(gè)形式參數(shù)可以用參數(shù)名,也可以用arguments[]數(shù)組形式,其中arguments[0]表示第一個(gè)參數(shù)。所以,javascript中Arguments對(duì)象是函數(shù)的實(shí)際參數(shù),下面,我們一起來進(jìn)入這神奇的國度,一窺究竟。
arguments.length屬性:js不會(huì)主動(dòng)為你判斷你到底給函數(shù)傳了多少個(gè)參數(shù),如果你多傳了,多余的部分就沒有被使用,如果你少傳了,那么沒傳的參數(shù)值就是undefined
所以我們可以借助arguments的length屬性來檢測調(diào)用函數(shù)時(shí)是否使用了正確數(shù)目的實(shí)際參數(shù),因?yàn)閖avascript是不會(huì)為你做這些事的。
JavaScript代碼
function f(x,y,z)
{
//首先檢查傳遞的參數(shù)數(shù)量是否正確
if(arguments.length != 3)
{
throw new Error("function f called with " + arguments.length + "arguments ,but it not 3 arguments.");
}
//下面運(yùn)行真正的函數(shù)
}
arguments還為我們提供了這樣一種可能,就是為一個(gè)函數(shù)傳任意數(shù)目的實(shí)際參數(shù):比如說,我想判斷你傳給我的一些數(shù)字的大小,取出最大的那個(gè),對(duì),沒錯(cuò),你傳多少參數(shù)都行,但是前提是你要傳數(shù)字,因?yàn)槲以诤瘮?shù)內(nèi)部懶得判斷了。
JavaScript代碼
function max()
{
var m = Number.NEGATIVE_INFINITY;//Number.NEGATIVE_INFINITY JavaScript內(nèi)最小的數(shù)字了
for(var i = 0; i < arguments.length; i++)
{
//只要有任何一個(gè)參數(shù)比m大,那么m就變成了這個(gè)參數(shù)的值
if(arguments[i] > m)
m = arguments[i];
}
return m;
}
怎么樣?這個(gè)方法很巧妙吧?
說明一下arguments與真正傳的形式參數(shù)是一致的:比如,你給函數(shù)傳了一個(gè)叫param的參數(shù),并且只有這一個(gè)參數(shù),那么param與arguments[0]都是對(duì)這個(gè)參數(shù)值的引用,改變其中一個(gè)值,即改變了二者所有的值。
JavaScript代碼
function change(param)
{
//比如我傳的param為simaopig,那么alert就是simaopig,
//如果啥也沒傳就會(huì)alert undefined
alert(param);
//用arguments[0]改變了這個(gè)參數(shù)的值
arguments[0] = 'xiaoxiaozi';
//沒錯(cuò),這個(gè)值變成了xiaoxiaozi
alert(param);
}
arguments的callee屬性:arguments的callee屬性是用來引用當(dāng)前正在執(zhí)行的函數(shù),這對(duì)未命名的函數(shù)調(diào)用自身非常有好處。
現(xiàn)在用arguments的這個(gè)callee簡單的實(shí)現(xiàn)。
JavaScript代碼
//用函數(shù)直接量,采用 arguments.callee屬性實(shí)現(xiàn)遞歸函數(shù)
var result = function(x){
if(x<=1) return 1;
return x*arguments.callee(x-1);
};
在最后提醒大家一點(diǎn),既然這個(gè)arguments這么厲害,那么我們就不要為變量命名為arguments 了,事實(shí)上arguments是javascript的保留字之一。
-----------------------------------------------------------
常用的JavaScript驗(yàn)證正則表達(dá)式
匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]
評(píng)注:匹配中文還真是個(gè)頭疼的事,有了這個(gè)表達(dá)式就好辦了
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]
評(píng)注:可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)
匹配空白行的正則表達(dá)式:ns*r
評(píng)注:可以用來刪除空白行
匹配HTML標(biāo)記的正則表達(dá)式:< (S*?)[^>]*>.*?|< .*? />
評(píng)注:網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能匹配部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無能為力
匹配首尾空白字符的正則表達(dá)式:^s*|s*$
評(píng)注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式
匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^s]*
評(píng)注:網(wǎng)上流傳的版本功能很有限,上面這個(gè)基本可以滿足需求
匹配帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
匹配國內(nèi)電話號(hào)碼:d{3}-d{8}|d{4}-d{7}
評(píng)注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號(hào):[1-9][0-9]{4,}
評(píng)注:騰訊QQ號(hào)從10000開始
匹配中國郵政編碼:[1-9]d{5}(?!d)
評(píng)注:中國郵政編碼為6位數(shù)字
匹配身份證:d{15}|d{18}
評(píng)注:中國的身份證為15位或18位
匹配ip地址:d+.d+.d+.d+
評(píng)注:提取ip地址時(shí)有用
匹配特定數(shù)字:
^[1-9]d*$ //匹配正整數(shù)
^-[1-9]d*$ //匹配負(fù)整數(shù)
^-?[1-9]d*$ //匹配整數(shù)
^[1-9]d*|0$ //匹配非負(fù)整數(shù)(正整數(shù) + 0)
^-[1-9]d*|0$ //匹配非正整數(shù)(負(fù)整數(shù) + 0)
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點(diǎn)數(shù)
^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負(fù)浮點(diǎn)數(shù)
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點(diǎn)數(shù)
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)
評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26個(gè)英文字母組成的字符串
^[A-Z]+$ //匹配由26個(gè)英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個(gè)英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個(gè)英文字母組成的字符串
^w+$ //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
在使用RegularExpressionValidator驗(yàn)證控件時(shí)的驗(yàn)證功能及其驗(yàn)證表達(dá)式介紹如下:
只能輸入數(shù)字:“^[0-9]*$”
只能輸入n位的數(shù)字:“^d{n}$”
只能輸入至少n位數(shù)字:“^d{n,}$”
只能輸入m-n位的數(shù)字:“^d{m,n}$”
只能輸入零和非零開頭的數(shù)字:“^(0|[1-9][0-9]*)$”
只能輸入有兩位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{2})?$”
只能輸入有1-3位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{1,3})?$”
只能輸入非零的正整數(shù):“^+?[1-9][0-9]*$”
只能輸入非零的負(fù)整數(shù):“^-[1-9][0-9]*$”
只能輸入長度為3的字符:“^.{3}$”
只能輸入由26個(gè)英文字母組成的字符串:“^[A-Za-z]+$”
只能輸入由26個(gè)大寫英文字母組成的字符串:“^[A-Z]+$”
只能輸入由26個(gè)小寫英文字母組成的字符串:“^[a-z]+$”
只能輸入由數(shù)字和26個(gè)英文字母組成的字符串:“^[A-Za-z0-9]+$”
只能輸入由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:“^w+$”
驗(yàn)證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間,
只能包含字符、數(shù)字和下劃線。
驗(yàn)證是否含有^%&’,;=?$”等字符:“[^%&',;=?$x22]+”
只能輸入漢字:“^[u4e00-u9fa5],{0,}$”
驗(yàn)證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
驗(yàn)證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
驗(yàn)證電話號(hào)碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
驗(yàn)證身份證號(hào)(15位或18位數(shù)字):“^d{15}|d{}18$”
驗(yàn)證一年的12個(gè)月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”
驗(yàn)證一個(gè)月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正確格式為:“01”“09”和“1”“31”。
匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff]
匹配空行的正則表達(dá)式:n[s| ]*r
匹配HTML標(biāo)記的正則表達(dá)式:/< (.*)>.*|< (.*) />/
匹配首尾空格的正則表達(dá)式:(^s*)|(s*$)
匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配網(wǎng)址URL的正則表達(dá)式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
(1)應(yīng)用:計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}
(2)應(yīng)用:javascript中沒有像vbscript那樣的trim函數(shù),我們就可以利用這個(gè)表達(dá)式來實(shí)現(xiàn)
String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, “”);
}
(3)應(yīng)用:利用正則表達(dá)式分解和轉(zhuǎn)換IP地址
function IP2V(ip) //IP地址轉(zhuǎn)換成對(duì)應(yīng)數(shù)值
{
re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達(dá)式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error(”Not a valid IP address!”)
}
}
(4)應(yīng)用:從URL地址中提取文件名的javascript程序
s=”http://www.9499.net/page1.htm”;
s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm
(5)應(yīng)用:利用正則表達(dá)式限制網(wǎng)頁表單里的文本框輸入內(nèi)容
用 正則表達(dá)式限制只能輸入中文:onkeyup=”value=”/blog/value.replace(/["^u4E00-u9FA5]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^u4E00-u9FA5]/g,”))”
用 正則表達(dá)式限制只能輸入全角字符: onkeyup=”value=”/blog/value.replace(/["^uFF00-uFFFF]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^uFF00-uFFFF]/g,”))”
用 正則表達(dá)式限制只能輸入數(shù)字:onkeyup=”value=”/blog/value.replace(/["^d]/g,”) “onbeforepaste= “clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”))”
用 正則表達(dá)式限制只能輸入數(shù)字和英文:onkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”