主頁 > 知識庫 > 日常收集整理php正則表達(dá)式(超常用)

日常收集整理php正則表達(dá)式(超常用)

熱門標(biāo)簽:地圖標(biāo)注商戶中心要收錢多少 宿遷智能外呼系統(tǒng)供應(yīng)商 css百度地圖標(biāo)注位置顯示 地圖標(biāo)注字母的軟件 實(shí)用地圖標(biāo)注app 線上教育ai外呼系統(tǒng) 鄂州人工智能電銷機(jī)器人軟件 400免費(fèi)電話去哪申請 菏澤智能ai電銷機(jī)器人銷售公司

以下是關(guān)于小編給大家日常收集整理php正則表達(dá)式,具體內(nèi)容請看下文詳解吧

$str = preg_replace("/(a.*?>)(.*?)(\/a>)/", '\1span>\2/span>\3', $str);

其中用了三個(gè)子模式(每個(gè)圓括號中內(nèi)容為一個(gè)子模式),第一個(gè)是鏈接開始標(biāo)簽,第二個(gè)是鏈接文本,第三個(gè)是/a>

然后第二個(gè)參數(shù)中\(zhòng)1、\2、\3就表示這三個(gè)部分,要替換成什么樣子還不簡單?

獲取頁面中的所有鏈接地址的PHP函數(shù)

下面這個(gè)用PHP寫的函數(shù),可以獲取任意的字符串$string中的所有鏈接地址($string可以是從一個(gè)HTML頁面文件直接讀取出來的字符串),結(jié)果保存在一個(gè)數(shù)組中返回.該函數(shù)自動把電子郵件地址排除在外,而且返回的數(shù)組中不會有重復(fù)元素.

function GetAllLink($string) 
{ 
$string = str_replace("\r","",$string); 
$string = str_replace("\n","",$string); 
$regex[url] = "((http|https|ftp|telnet|news):\/\/)?([a-z0-9_\-\/\.]+\.[][a-z0-9:;#@=_~%\&;\/\.\,\+\-]+)"; 
$regex[email] = "([a-z0-9_\-]+)@([a-z0-9_\-]+\.[a-z0-9\-\._\-]+)"; 
//去掉標(biāo)簽之間的文字 
$string = eregi_replace(">[^>]+",">", $string); 
//去掉JAVASCRIPT代碼 
$string = eregi_replace("!--.*//-->","", $string); 
//去掉非a>的HTML標(biāo)簽 
$string = eregi_replace("[^a][^>]*>","", $string); 
//去掉EMAIL鏈接 
$string = eregi_replace("a([ ]+)href=([\"']*)mailto:($regex[email])([\"']*)[^>]*>","", $string); 
//替換需要的網(wǎng)頁鏈接 
$string = eregi_replace("a([ ]+)href=([\"']*)($regex[url])([\"']*)[^>]*>","\\3\t", $string); 
$output[0] = strtok($string, "\t"); 
while(($temp = strtok("\t"))) 
{ 
if($temp  !in_array($temp, $output)) 
$output[++$i] = $temp; 
} 
return $output; 
}

以下是以PHP的語法所寫的示例

驗(yàn)證字符串是否只含數(shù)字與英文,字符串長度并在4~16個(gè)字符之間

?php 
$str = 'a1234'; 
if (preg_match("^[a-zA-Z0-9]{4,16}$", $str)) { 
echo "驗(yàn)證成功";} else { 
echo "驗(yàn)證失敗";}?>

簡易的臺灣身分證字號驗(yàn)證

?php 
$str = 'a1234'; 
if (preg_match("^(?:\d{15}|\d{18})$", $str)) { 
echo "驗(yàn)證成功"; 
} else { 
echo "驗(yàn)證失敗";} 
?>

下面的代碼實(shí)現(xiàn)文字中的代碼塊,功能就如你在腳本之家看到的代碼一樣。

function codedisp($code) { 
global $discuzcodes; 
$discuzcodes['pcodecount']++; 
$code = htmlspecialchars(str_replace('\\"', '"', preg_replace("/^[\n\r]*(.+?)[\n\r]*$/is", "\\1", $code))); 
$discuzcodes['codehtml'][$discuzcodes['pcodecount']] = "br>div class=\"msgheader\">div class=\"right\">a href=\"###\" class=\"smalltxt\" onclick=\"copycode($('phpcode$discuzcodes[codecount]'));\">[復(fù)制此代碼]/a>/div>代碼如下:/div>div class=\"msgborder\" id=\"phpcode$discuzcodes[codecount]\">".fhtml2($code)."/div>br>"; 
$discuzcodes['codecount']++; 
return "[\tDISCUZ_CODE_$discuzcodes[pcodecount]\t]"; 
} 
$message = preg_replace("/\s*\[code\](.+?)\[\/code\]\s*/ies", "codedisp('\\1')", $message); 
$message = preg_replace("/\s*\[html\](.+?)\[\/html\]\s*/ies", "htmldisp('\\1')", $message);

匹配中文字符的正則表達(dá)式: [\u4e00-\u9fa5]

評注:匹配中文還真是個(gè)頭疼的事,有了這個(gè)表達(dá)式就好辦了

匹配雙字節(jié)字符(包括漢字在內(nèi)):[^\x00-\xff]

評注:可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)

匹配空白行的正則表達(dá)式:\n\s*\r

評注:可以用來刪除空白行

匹配HTML標(biāo)記的正則表達(dá)式:(\S*?)[^>]*>.*?/\1>|.*? />

評注:網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能匹配部分,對于復(fù)雜的嵌套標(biāo)記依舊無能為力

匹配首尾空白字符的正則表達(dá)式:^\s*|\s*$

評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式

匹配Email地址的正則表達(dá)式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

評注:表單驗(yàn)證時(shí)很實(shí)用

匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://[^\s]*

評注:網(wǎng)上流傳的版本功能很有限,上面這個(gè)基本可以滿足需求

匹配帳號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

評注:表單驗(yàn)證時(shí)很實(shí)用

匹配國內(nèi)電話號碼:\d{3}-\d{8}|\d{4}-\d{7}

評注:匹配形式如 0511-4405222 或 021-87888822

匹配騰訊QQ號:[1-9][0-9]{4,}
評注:騰訊QQ號從10000開始

匹配中國郵政編碼:[1-9]\d{5}(?!\d)

評注:中國郵政編碼為6位數(shù)字

匹配身份證:\d{15}|\d{18}

評注:中國的身份證為15位或18位

匹配ip地址:\d+\.\d+\.\d+\.\d+

評注:提取ip地址時(shí)有用

匹配特定數(shù)字:

^[1-9]\d*$    //匹配正整數(shù)
 ^-[1-9]\d*$   //匹配負(fù)整數(shù)
 ^-?[1-9]\d*$   //匹配整數(shù)
 ^[1-9]\d*|0$  //匹配非負(fù)整數(shù)(正整數(shù) + 0)
 ^-[1-9]\d*|0$   //匹配非正整數(shù)(負(fù)整數(shù) + 0)
 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮點(diǎn)數(shù)
 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配負(fù)浮點(diǎn)數(shù)
 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮點(diǎn)數(shù)
 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)

評注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正

匹配特定字符串:

^[A-Za-z]+$  //匹配由26個(gè)英文字母組成的字符串
 ^[A-Z]+$  //匹配由26個(gè)英文字母的大寫組成的字符串
 ^[a-z]+$  //匹配由26個(gè)英文字母的小寫組成的字符串
 ^[A-Za-z0-9]+$  //匹配由數(shù)字和26個(gè)英文字母組成的字符串
 ^\w+$  //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串

下面是一些特殊字符:

正則表達(dá)式中的特殊字符: (學(xué)習(xí)參考書-<<精通正則表達(dá)式>>)

字符
意義:對于字符,通常表示按字面意義,指出接著的字符為特殊字符,不作解釋。
例如:/b/匹配字符'b',通過在b 前面加一個(gè)反斜杠,也就是/b/,則該字符變成特殊字符,表示
匹配一個(gè)單詞的分界線。
或者:
對于幾個(gè)字符,通常說明是特殊的,指出緊接著的字符不是特殊的,而應(yīng)該按字面解釋。
例如:*是一個(gè)特殊字符,匹配任意個(gè)字符(包括0個(gè)字符);例如:/a*/意味匹配0個(gè)或多個(gè)a。
為了匹配字面上的*,在a前面加一個(gè)反斜杠;例如:/a*/匹配'a*'。

字符^
意義:表示匹配的字符必須在最前邊。
例如:/^A/不匹配"an A,"中的'A',但匹配"An A."中最前面的'A'。

字符$
意義:與^類似,匹配最末的字符。
例如:/t$/不匹配"eater"中的't',但匹配"eat"中的't'。

字符*
意義:匹配*前面的字符0次或n次。
例如:/bo*/匹配"A ghost booooed"中的'boooo'或"A bird warbled"中的'b',但不匹配"A goat g
runted"中的任何字符。

字符+
意義:匹配+號前面的字符1次或n次。等價(jià)于{1,}。
例如:/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。

字符?
意義:匹配?前面的字符0次或1次。
例如:/e?le?/匹配"angel"中的'el'和"angle."中的'le'。

字符.
意義:(小數(shù)點(diǎn))匹配除換行符外的所有單個(gè)的字符。
例如:/.n/匹配"nay, an apple is on the tree"中的'an'和'on',但不匹配'nay'。

字符(x)
意義:匹配'x'并記錄匹配的值。
例如:/(foo)/匹配和記錄"foo bar."中的'foo'。匹配子串能被結(jié)果數(shù)組中的素[1], ..., [n] 返
回,或被RegExp對象的屬性$1, ..., $9返回。

字符x|y
意義:匹配'x'或者'y'。
例如:/green|red/匹配"green apple"中的'green'和"red apple."中的'red'。

字符{n}
意義:這里的n是一個(gè)正整數(shù)。匹配前面的n個(gè)字符。
例如:/a{2}/不匹配"candy,"中的'a',但匹配"caandy," 中的所有'a'和"caaandy."中前面的兩個(gè)
'a'。

字符{n,}
意義:這里的n是一個(gè)正整數(shù)。匹配至少n個(gè)前面的字符。
例如:/a{2,}不匹配"candy"中的'a',但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'

字符{n,m}
意義:這里的n和m都是正整數(shù)。匹配至少n個(gè)最多m個(gè)前面的字符。
例如:/a{1,3}/不匹配"cndy"中的任何字符,但匹配 "candy,"中的'a',"caandy," 中的前面兩個(gè)
'a'和"caaaaaaandy"中前面的三個(gè)'a',注意:即使"caaaaaaandy" 中有很多個(gè)'a',但只匹配前面的三
個(gè)'a'即"aaa"。

字符[xyz]
意義:一字符列表,匹配列出中的任一字符。你可以通過連字符-指出一個(gè)字符范圍。
例如:[abcd]跟[a-c]一樣。它們匹配"brisket"中的'b'和"ache"中的'c'。

字符[^xyz]
意義:一字符補(bǔ)集,也就是說,它匹配除了列出的字符外的所有東西。 你可以使用連字符-指出一
字符范圍。
例如:[^abc]和[^a-c]等價(jià),它們最早匹配"brisket"中的'r'和"chop."中的'h'。

字符
意義:匹配一個(gè)空格(不要與b混淆)

字符b
意義:匹配一個(gè)單詞的分界線,比如一個(gè)空格(不要與混淆)
例如:/bnw/匹配"noonday"中的'no',/wyb/匹配"possibly yesterday."中的'ly'。

字符B
意義:匹配一個(gè)單詞的非分界線
例如:/wBn/匹配"noonday"中的'on',/yBw/匹配"possibly yesterday."中的'ye'。

字符cX
意義:這里的X是一個(gè)控制字符。匹配一個(gè)字符串的控制字符。
例如:/cM/匹配一個(gè)字符串中的control-M。

字符d
意義:匹配一個(gè)數(shù)字,等價(jià)于[0-9]。
例如:/d/或/[0-9]/匹配"B2 is the suite number."中的'2'。

字符D
意義:匹配任何的非數(shù)字,等價(jià)于[^0-9]。
例如:/D/或/[^0-9]/匹配"B2 is the suite number."中的'B'。

字符f
意義:匹配一個(gè)表單符

字符n
意義:匹配一個(gè)換行符

字符r
意義:匹配一個(gè)回車符

字符s
意義:匹配一個(gè)單個(gè)white空格符,包括空格,tab,form feed,換行符,等價(jià)于[ fnrtv]。
例如:/sw*/匹配"foo bar."中的' bar'。

字符S
意義:匹配除white空格符以外的一個(gè)單個(gè)的字符,等價(jià)于[^ fnrtv]。
例如:/S/w*匹配"foo bar."中的'foo'。

字符t
意義:匹配一個(gè)制表符

字符v
意義:匹配一個(gè)頂頭制表符

字符w
意義:匹配所有的數(shù)字和字母以及下劃線,等價(jià)于[A-Za-z0-9_]。
例如:/w/匹配"apple,"中的'a',"$5.28,"中的'5'和"3D."中的'3'。

字符W
意義:匹配除數(shù)字、字母外及下劃線外的其它字符,等價(jià)于[^A-Za-z0-9_]。
例如:/W/或者/[^$A-Za-z0-9_]/匹配"50%."中的'%'。

字符n
意義:這里的n是一個(gè)正整數(shù)。匹配一個(gè)正則表達(dá)式的最后一個(gè)子串的n的值(計(jì)數(shù)左圓括號)。

例如:/apple(,)sorange1/匹配"apple, orange, cherry, peach."中的'apple, orange',下面
有一個(gè)更加完整的例子。
注意:如果左圓括號中的數(shù)字比n指定的數(shù)字還小,則n取下一行的八進(jìn)制escape作為描述。

字符ooctal和xhex
意義:這里的ooctal是一個(gè)八進(jìn)制的escape值,而xhex是一個(gè)十六進(jìn)制的escape值,允許在一個(gè)正則表達(dá)式中嵌入ASCII碼。

通用模式

定界符,通常使用 "/"做為定界符開始和結(jié)束,也可以使用"#"。

什么時(shí)候使用"#"呢?一般是在你的字符串中有很多"/"字符的時(shí)候,因?yàn)檎齽t的時(shí)候這種字符需要轉(zhuǎn)義,比如uri。
使用"/"定界符的代碼如下.

?php 
$regex = '/^http://([w.]+)/([w]+)/([w]+).html$/i'; 
$str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; 
$matches = array(); 
if(preg_match($regex, $str, $matches)){ 
var_dump($matches); 
} 
echo "n";

preg_match中的$matches[0]將包含與整個(gè)模式匹配的字符串。

使用"#"定界符的代碼如下.這個(gè)時(shí)候?qū)?/"就不轉(zhuǎn)義!

$regex = '#^http://([w.]+)/([w]+)/([w]+).html$#i'; 
$str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; 
$matches = array(); 
if(preg_match($regex, $str, $matches)){ 
var_dump($matches); 
} 
echo "n";

修飾符:用于改變正則表達(dá)式的行為。

我們看到的('/^http://([w.]+)/([w]+)/([w]+).html/i')中的最后一個(gè)"i"就是修飾符,表示忽略大小寫,還有一個(gè)我們經(jīng)常用到的是"x"表示忽略空格。

貢獻(xiàn)代碼:

$regex = '/HELLO/'; 
$str = 'hello word'; 
$matches = array(); 
if(preg_match($regex, $str, $matches)){ 
echo 'No i:Valid Successful!',"n"; 
} 
if(preg_match($regex.'i', $str, $matches)){ 
echo 'YES i:Valid Successful!',"n"; 
}

字符域:[w]用方括號擴(kuò)起來的部分就是字符域。

限定符:如[w]{3,5}或者[w]*或者[w]+這些[w]后面的符號都表示限定符。現(xiàn)介紹具體意義。
{3,5}表示3到5個(gè)字符。{3,}超過3個(gè)字符,{,5}最多5個(gè),{3}三個(gè)字符。
* 表示0到多個(gè)
+ 表示1到多個(gè)。
脫字符號
^:
> 放在字符域(如:[^w])中表示否定(不包括的意思)——“反向選擇”
> 放在表達(dá)式之前,表示以當(dāng)前這個(gè)字符開始。(/^n/i,表示以n開頭)。
注意,我們經(jīng)常管""叫"跳脫字符"。用于轉(zhuǎn)義一些特殊符號,如".","/"
界符:正則表達(dá)式的形式一般如下:
/love/
其中位于“/”定界符之間的部分就是將要在目標(biāo)對象中進(jìn)行匹配的模式。
元字符:就是指那些在正則表達(dá)式中具有特殊意義的專用字符,可以用來規(guī)定其前導(dǎo)字符(即位于元字符前面的字符)在目標(biāo)對象中的出現(xiàn)模式。
較為常用的元字符包括: “+”, “*”,以及 “?”。
“+”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對象中連續(xù)出現(xiàn)一次或多次
“*”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對象中出現(xiàn)零次或連續(xù)多次,
“?”元字符規(guī)定其前導(dǎo)字符必須在目標(biāo)對象中連續(xù)出現(xiàn)零次或一次。
下面,就讓我們來看一下正則表達(dá)式元字符的具體應(yīng)用。
/fo+/
因?yàn)樯鲜稣齽t表達(dá)式中包含“+”元字符(它前面的“o”是前導(dǎo)字符),表示可以與目標(biāo)對象中的“fool”, “fo”等在字母f后面連續(xù)出現(xiàn)一個(gè)或多個(gè)字母o的字符串相匹配。
除了元字符之外,用戶還可以精確指定模式在匹配對象中出現(xiàn)的頻率。例如,
/jim{2,6}/
上述正則表達(dá)式規(guī)定字符m可以在匹配對象中連續(xù)出現(xiàn)2-6次,因此,上述正則表達(dá)式可以同jimmy或jimmmmmy等字符串相匹配。
其它幾個(gè)重要的元字符的使用方式。
s:用于匹配單個(gè)空格符,包括tab鍵和換行符;
S:用于匹配除單個(gè)空格符之外的所有字符;
d:用于匹配從0到9的數(shù)字;
w:用于匹配字母,數(shù)字或下劃線字符;
W:用于匹配所有與w不匹配的字符;
. :用于匹配除換行符之外的所有字符。
(說明:我們可以把s和S以及w和W看作互為逆運(yùn)算)
下面,我們就通過實(shí)例看一下如何在正則表達(dá)式中使用上述元字符。
/s+/
上述正則表達(dá)式可以用于匹配目標(biāo)對象中的一個(gè)或多個(gè)空格字符。
除了我們以上所介紹的元字符之外,正則表達(dá)式中還具有另外一種較為獨(dú)特的專用字符,即定位符。
定位符:用于規(guī)定匹配模式在目標(biāo)對象中的出現(xiàn)位置。
較為常用的定位符包括: “^”, “$”, “b” 以及 “B”。
“^”定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)字符串的開頭
“$”定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)對象的結(jié)尾
b定位符規(guī)定匹配模式必須出現(xiàn)在目標(biāo)字符串的開頭或結(jié)尾的兩個(gè)邊界之一
“B”定位符則規(guī)定匹配對象必須位于目標(biāo)字符串的開頭和結(jié)尾兩個(gè)邊界之內(nèi),即匹配對象既不能作為目標(biāo)字符串的開頭,也不能作為目標(biāo)字符串的結(jié)尾。同樣,我們
也可以把“^”和“$”以及“b”和“B”看作是互為逆運(yùn)算的兩組定位符。舉例來說:
/^hell/
因?yàn)樯鲜稣齽t表達(dá)式中包含“^”定位符,所以可以與目標(biāo)對象中以 “hell”, “hello”或 “hellhound”開頭的字符串相匹配。
/ar$/
因?yàn)樯鲜稣齽t表達(dá)式中包含“$”定位符,所以可以與目標(biāo)對象中以 “car”, “bar”或 “ar” 結(jié)尾的字符串相匹配。
/bbom/
因?yàn)樯鲜稣齽t表達(dá)式模式以“b”定位符開頭,所以可以與目標(biāo)對象中以 “bomb”, 或 “bom”開頭的字符串相匹配。
/manb/
因?yàn)樯鲜稣齽t表達(dá)式模式以“b”定位符結(jié)尾,所以可以與目標(biāo)對象中以 “human”, “woman”或 “man”結(jié)尾的字符串相匹配。
為了能夠方便用戶更加靈活的設(shè)定匹配模式,正則表達(dá)式允許使用者在匹配模式中指定某一個(gè)范圍而不局限于具體的字符。例如:
/[A-Z]/
上述正則表達(dá)式將會與從A到Z范圍內(nèi)任何一個(gè)大寫字母相匹配。
/[a-z]/
上述正則表達(dá)式將會與從a到z范圍內(nèi)任何一個(gè)小寫字母相匹配。
/[0-9]/
上述正則表達(dá)式將會與從0到9范圍內(nèi)任何一個(gè)數(shù)字相匹配。
/([a-z][A-Z][0-9])+/
上述正則表達(dá)式將會與任何由字母和數(shù)字組成的字符串,如 “aB0” 等相匹配。這里需要提醒用戶注意的一點(diǎn)就是可以在正則表達(dá)式中使用 “()” 把字符串組合在一起。
“()”符號:包含的內(nèi)容必須同時(shí)出現(xiàn)在目標(biāo)對象中。因此,上述正則表達(dá)式將無法與諸如 “abc”等的字符串匹配,因?yàn)椤癮bc”中的最后一個(gè)字符為字母而非數(shù)字。
如果我們希望在正則表達(dá)式中實(shí)現(xiàn)類似編程邏輯中的“或”運(yùn)算,在多個(gè)不同的模式中任選一個(gè)進(jìn)行匹配的話,可以使用管道符: “|”。例如:
/to|too|2/
上述正則表達(dá)式將會與目標(biāo)對象中的 “to”, “too”, 或 “2” 相匹配。
否定符:“[^]”。與我們前文所介紹的定位符 “^” 不同,否定符 “[^]”規(guī)定目標(biāo)對象中不能存在模式中所規(guī)定的字符串。例如:
/[^A-C]/
上述字符串將會與目標(biāo)對象中除A,B,和C之外的任何字符相匹配。一般來說,當(dāng)“^”出現(xiàn)在 “[]”內(nèi)時(shí)就被視做否定運(yùn)算符;而當(dāng)“^”位于“[]”之外,或沒有“[]”時(shí),則應(yīng)當(dāng)被視做定位符。
最后,當(dāng)用戶需要在正則表達(dá)式的模式中加入元字符,并查找其匹配對象時(shí),可以使用
轉(zhuǎn)義符:“”。例如:
/Th*/
上述正則表達(dá)式將會與目標(biāo)對象中的“Th*”而非“The”等相匹配。
實(shí)際經(jīng)驗(yàn)介紹
還是得說說 ^ 和 $ 他們是分別用來匹配字符串的開始和結(jié)束,以下分別舉例說明:
“^The”:開頭一定要有”The”字符串;
“of despair$”:結(jié)尾一定要有”of despair” 的字符串;
那么,
“^abc$”:就是要求以abc開頭和以abc結(jié)尾的字符串,實(shí)際上是只有abc匹配;
“notice”:匹配包含notice的字符串;
你可以看見如果你沒有用我們提到的兩個(gè)字符(最后一個(gè)例子),就是說模式(正則表達(dá)式)可以出現(xiàn)在被檢驗(yàn)字符串的任何地方,你沒有把他鎖定到兩邊。
接著,說說 ‘*' ‘+' 和 ‘?'
他們用來表示一個(gè)字符可以出現(xiàn)的次數(shù)或者順序,他們分別表示:
“zero or more”相當(dāng)于{0,}
“one or more”相當(dāng)于{1,}
“zero or one.”相當(dāng)于{0,1}
這里是一些例子:
“ab*”:和ab{0,}同義,匹配以a開頭,后面可以接0個(gè)或者N個(gè)b組成的字符串(”a”, “ab”, “abbb”, 等);
“ab+”:和ab{1,}同義,同上條一樣,但最少要有一個(gè)b存在 (”ab” “abbb”等);
“ab?”:和ab{0,1}同義,可以沒有或者只有一個(gè)b;
“a?b+$”:匹配以一個(gè)或者0個(gè)a再加上一個(gè)以上的b結(jié)尾的字符串。
要點(diǎn):'*' ‘+' 和 ‘?' 只管它前面那個(gè)字符。
你也可以在大括號里面限制字符出現(xiàn)的個(gè)數(shù),比如:
“ab{2}”: 要求a后面一定要跟兩個(gè)b(一個(gè)也不能少)(”abb”);
“ab{2,}”: 要求a后面一定要有兩個(gè)或者兩個(gè)以上b(如”abb” “abbbb” 等);
“ab{3,5}”: 要求a后面可以有2-5個(gè)b(”abbb”, “abbbb”, or “abbbbb”)。
現(xiàn)在我們把一定幾個(gè)字符放到小括號里,比如:
“a(bc)*”: 匹配 a 后面跟0個(gè)或者一個(gè)”bc”;
“a(bc){1,5}”: 一個(gè)到5個(gè) “bc”;
還有一個(gè)字符 ‘|',相當(dāng)于OR操作:
“hi|hello”: 匹配含有”hi” 或者 “hello” 的 字符串;
“(b|cd)ef”: 匹配含有 “bef” 或者 “cdef”的字符串;
“(a|b)*c”: 匹配含有這樣多個(gè)(包括0個(gè))a或b,后面跟一個(gè)c的字符串;
一個(gè)點(diǎn)('.')可以代表所有的單一字符,不包括” ”
如果,要匹配包括” ”在內(nèi)的所有單個(gè)字符,怎么辦?
用'[ .]'這種模式。
“a.[0-9]”: 一個(gè)a加一個(gè)字符再加一個(gè)0到9的數(shù)字;
“^.{3}$”: 三個(gè)任意字符結(jié)尾。
中括號括住的內(nèi)容只匹配一個(gè)單一的字符
“[ab]”: 匹配單個(gè)的 a 或者 b ( 和 “a│b” 一樣);
“[a-d]”: 匹配'a' 到'd'的單個(gè)字符 (和”a│b│c│d” 還有 “[abcd]”效果一樣);
一般我們都用[a-zA-Z]來指定字符為一個(gè)大小寫英文:
“^[a-zA-Z]”: 匹配以大小寫字母開頭的字符串;
“[0-9]%”: 匹配含有 形如 x% 的字符串;
“,[a-zA-Z0-9]$”: 匹配以逗號再加一個(gè)數(shù)字或字母結(jié)尾的字符串;
你也可以把你不想要得字符列在中括號里,你只需要在總括號里面使用'^' 作為開頭 “%[^a-zA-Z]%” 匹配含有兩個(gè)百分號里面有一個(gè)非字母的字符串。
要點(diǎn):^用在中括號開頭的時(shí)候,就表示排除括號里的字符。
為了PHP能夠解釋,你必須在這些字符面前后加”,并且將一些字符轉(zhuǎn)義。
不要忘記在中括號里面的字符是這條規(guī)路的例外—在中括號里面,所有的特殊字符,包括(”),都將失去他們的特殊性質(zhì) “[*+?{}.]”匹配含有這些字符的字符串:
還有,正如regx的手冊告訴我們:”如果列表里含有']',最好把它作為列表里的第一個(gè)字符(可能跟在'^'后面)。如果含有'-',最好把它放在最前面或者最后面
, or 或者一個(gè)范圍的第二個(gè)結(jié)束點(diǎn)[a-d-0-9]中間的‘-'將有效。
看了上面的例子,你對{n,m}應(yīng)該理解了吧。要注意的是,n和m都不能為負(fù)整數(shù),而且n總是小于m。這樣,才能 最少匹配n次且最多匹配m次。如”p{1,5}”將匹配
“pvpppppp”中的前五個(gè)p
下面說說以開頭的
b 書上說他是用來匹配一個(gè)單詞邊界,就是…比如'veb',可以匹配love里的ve而不匹配very里有ve
B 正好和上面的b相反。
正則表達(dá)式的其他用法
提取字符串
ereg() and eregi() 有一個(gè)特性是允許用戶通過正則表達(dá)式去提取字符串的一部分(具體用法你可以閱讀手冊)。比如說,我們想從 path/URL 提取文件名,下面的代
碼就是你需要:
ereg(”([^\/]*)$”, $pathOrUrl, $regs);
echo $regs[1];
高級的代換
ereg_replace() 和 eregi_replace()也是非常有用的,假如我們想把所有的間隔負(fù)號都替換成逗號:
ereg_replace(”[ t]+”, “,”, trim($str));

以下為引用的內(nèi)容:

preg_match()和preg_match_all()
preg_quote()
preg_split()
preg_grep()
preg_replace()

函數(shù)的具體使用,我們可以通過PHP手冊來找到,下面分享一些平時(shí)積累的正則表達(dá)式:
匹配action屬性

以下為引用的內(nèi)容:

$str = '';
$match = '';
preg_match_all('/s+action="(?!http:)(.*?)"s/', $str, $match);
print_r($match);

在正則中使用回調(diào)函數(shù)

以下為引用的內(nèi)容:

/** 
* replace some string by callback function 
* 
*/ 
function callback_replace() { 
$url = 'http://esfang.house.sina.com.cn'; 
$str = ''; 
$str = preg_replace ( '/(?=saction=")(?!http:)(.*?)(?="s)/e', 'search($url, \1)', $str ); 
echo $str; 
} 
function search($url, $match){ 
return $url . '/' . $match; 
}

帶斷言的正則匹配

$match = ''; 
$str = 'xxxxxx.com.cn bold font 
paragraph text 
'; 
preg_match_all ( '/(?=(w{1})>).*(?=/1>)/', $str, $match ); 

echo "匹配沒有屬性的HTML標(biāo)簽中的內(nèi)容:";

print_r ( $match );

替換HTML源碼中的地址

以下為引用的內(nèi)容:

$form_html = preg_replace ( '/(?=saction="|ssrc="|shref=")(?!http:|javascript)(.*?)(?="s)/e', 'add_url($url, '\1')', $form_html );
元字符

在上面的例子中,^ 、d 及 $ 等這些符號,代表了特定的匹配意義,我們稱之為元字符,常用的元字符如下:
元字符 說明
. 匹配除換行符意外的任意字符
w 匹配字母或數(shù)字或下劃線
s 匹配任意的空白符
d 匹配數(shù)字
b 匹配單詞的開始或結(jié)束
^ 匹配字符串的開始
$ 匹配字符串的結(jié)束
[x] 匹配x字符,如匹配字符串中的 a、b 和 c 字符
W w的反義,即匹配任意非字母,數(shù)字,下劃線和漢字的字符
S s的反義,即匹配任意非空白符的字符
D d的反義,即匹配任意非數(shù)字的字符
B b的反義,即不是單詞開頭或結(jié)束的位置
[^x] 匹配除了 x 意外的任意字符,如 [^abc] 匹配除了 abc 這幾個(gè)字母之外的任意字符

以上內(nèi)容是小編給大家分享的日常收集整理php正則表達(dá)式(超常用),希望大家能把以上知識學(xué)以致用,使用到項(xiàng)目中去,謝謝。

您可能感興趣的文章:
  • 最常用的PHP正則表達(dá)式收集整理
  • PHP 正則表達(dá)式常用函數(shù)使用小結(jié)
  • 非常重要的php正則表達(dá)式詳解
  • php正則表達(dá)式使用的詳細(xì)介紹
  • php中字符串和正則表達(dá)式詳解
  • php使用正則表達(dá)式提取字符串中尖括號、小括號、中括號、大括號中的字符串
  • php過濾HTML標(biāo)簽、屬性等正則表達(dá)式匯總
  • PHP正則表達(dá)式基礎(chǔ)入門
  • php的正則表達(dá)式完全手冊
  • PHP中的正則表達(dá)式實(shí)例詳解
  • PHP正則表達(dá)式筆記與實(shí)例詳解

標(biāo)簽:三亞 六安 池州 綿陽 梅州 恩施 鞍山 咸陽

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《日常收集整理php正則表達(dá)式(超常用)》,本文關(guān)鍵詞  日常,收集,整理,php,正則,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《日常收集整理php正則表達(dá)式(超常用)》相關(guān)的同類信息!
  • 本頁收集關(guān)于日常收集整理php正則表達(dá)式(超常用)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章