正則表達式的語法就不多說了,大家可以自己搜索查閱相關(guān)資料學習。本文所舉例子是在《JavaScript語言精粹》上看到的,看完之后對正則表達式有了進一步的理解,故分享之。
例子
//這是一個用來匹配URL的正則表達式,分組獲取不同部分的信息
var parse_url = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\&;([^#]*))?(?:#(.*))?$/;
var url = "http://www.ora.com:80/goodparts?q#fragment";
var result = parse_url.exec(url);
var names = ["url", "scheme", "slash", "host", "port", "path", "query", "hash"];var i;
for (i = 0; i names.length; i++) {
document.writeln(names[i] + ": " + result[i] + "br/>");
}
//這段代碼的輸出結(jié)果如下:
url: http://www.ora.com:80/goodparts?q#fragment
scheme: http
slash: //
host: www.ora.com
port: 80
path: goodparts
query: q
hash: fragment
解析
下面讓我們分解parse_url的各個部分,看看它是如何工作的:
^
^字符表示此字符串的開始,它是一個錨,指引exec不要跳過那些不像URL的前綴,只匹配那些從開頭就像URL一樣的字符串。
(?:([A-Za-z]+):)?
這個因子匹配一個協(xié)議名,但僅當它后面跟隨一個 :(冒號)的時候才匹配。(?: . . .)表示一個非捕獲型分組(noncapturing group)。后綴 ? 表示這個分組是可選的,它表示重復0次或1次。( . . .)表示一個捕獲型分組。一個捕獲型分組會復制它所匹配的文本,并把其放到result數(shù)組里。每個捕獲型分組都會被指定一個編號。第一個捕獲型分組的編號是1,所以該分組所匹配的文本副本會出現(xiàn)在result[1]中。 [ . . .]表示一個字符類。A-Za-z這個字符類包含26個大寫字母和26個小寫字母。連接字符 - 表示范圍從A-Z。后綴 + 表示這個字符類會被匹配一次或多次。這個組后面跟著字符 : ,它會按字面進行匹配。
(\/{0,3})
這個因子是捕獲型分組2,匹配//。\ /表示應(yīng),該匹配 / (斜杠)。它用 \ (反斜杠)來進行轉(zhuǎn)義,這樣它就不會被錯誤地解釋為這個正則表達式的結(jié)束符。后綴 {0,3} 表示 / 會匹配0~3次。
([0-9.\-A-Za-z]+)
這個因子是捕獲型分組3。它會匹配一個主機名,由一個或多個數(shù)字、字母以及 . 或 - 字符組成。- 會被轉(zhuǎn)義為 \- 以防止與表示范圍的連字符相混淆。
(?::(\d+))?
這個可選的因子匹配端口號,它是由一個前置 : 加上一個或多個數(shù)字而組成的序列。\d表示一個數(shù)字字符。一個或多個數(shù)字組成的數(shù)字串會被捕獲型分組4捕獲。
(?:\/([^?#]*))?
這個因子也是可選的分組,匹配路徑。該分組以一個 / 開始。之后的字符類[^?#]以一個^開始,它表示這個類包含除 ? 和 # 之外的所有字符。* 表示這個字符類會被匹配0次或多次。
注意我在這里的處理是不嚴謹?shù)?。這個類匹配除 ? 和 # 之外的所有字符,其中包括了行結(jié)束符、控制字符、以及其他大量不應(yīng)在此被匹配的字符。大多數(shù)情況下,它會按照我們的預(yù)期去做,但某些惡意文本可能會有滲漏進來的風險。不嚴謹?shù)恼齽t表示式是一個常見的安全漏洞發(fā)源地。寫不嚴謹?shù)恼齽t表達式比寫嚴謹?shù)恼齽t表示式要容易的多。
(?:\&;([^#]*))?
這個因子是一個以一個 ? 開始的可選分組。它包含捕獲型分組6,這個分組包含0個或多個非#字符。
(?:#(.*))?
這個因子是以 # 開始的可選分組。. 會匹配除行結(jié)束符以外的所有字符。
$
$表示這個字符串的結(jié)束。它保證在這個URL的尾部沒有其他更多的內(nèi)容了。
通過這個簡單例子,相信大家對正則表達式有了更進一步的理解,祝大家學習愉快!
您可能感興趣的文章:- js使用正則子表達式匹配首字母與尾字母相同單詞的方法
- 正則表達式、分組、子匹配(子模式)、非捕獲子匹配(子模式)
- 深入分析正則表達式的子模式
- php 正則表達式的子模式詳解
- PHP正則表達式的逆向引用與子模式分析
- 正則表達式教程之位置匹配詳解
- 正則表達式教程之重復匹配詳解
- 正則表達式教程之元字符的使用詳解
- 正則表達式教程之匹配一組字符詳解
- 正則表達式教程之匹配單個字符詳解
- 正則表達式教程之操作符及說明詳解
- 正則表達式教程之子表達式用法分析