在PHP中有兩套正則表達(dá)式函數(shù)庫,兩者功能相似,只是執(zhí)行效率略有差異:
一套是由PCRE(Perl Compatible Regular Expression)庫提供的。使用“preg_”為前綴命名的函數(shù);
一套由POSIX(Portable Operating System Interface of Unix )擴(kuò)展提供的(PHP默認(rèn))。使用以“ereg_”為前綴命名的函數(shù);
PHP中,正則表達(dá)式有三個(gè)作用:
匹配,也常常用于從字符串中析取信息。
用新文本代替匹配文本。
將一個(gè)字符串拆分為一組更小的信息塊。
一個(gè)正則表達(dá)式中至少包含一個(gè)原子。
原子(普通字符,如英文字符)
元字符(有特殊功用的字符)
模式修正字符(對正則表達(dá)式語義的修正)
原子(Atom)
單個(gè)字符、數(shù)字,如a~z,A~Z,0~9。
模式單元,如(ABC)可以理解為由多個(gè)原子組成的大的原子。
原子表,如 [ABC]。
重新使用的模式單元,如:\\1
普通轉(zhuǎn)義字符,如:\d, \D, \w
轉(zhuǎn)義元字符,如:\*,\.
POSIX正則表達(dá)式
POSIX正則表達(dá)式全稱為Portable Operating System Interface of Unix,意為UNIX可移植操作系實(shí)現(xiàn)接口。
構(gòu)造POSIX正則表達(dá)式的方法和創(chuàng)建數(shù)學(xué)表達(dá)式的方法一樣,也就是用多種元字符與操作符將小的表達(dá)式結(jié)合在一起來創(chuàng)建更大的表達(dá)式。
元字符(Meta-character)
元字符是用于構(gòu)造規(guī)則表達(dá)式的具有特殊含義的字符。如果要在正則表達(dá)式中包含元字符本身,必須在其前加上”\”進(jìn)行轉(zhuǎn)義
元字符 說明
* 0次、1次或多次匹配其前的原子
+ 1次或多次匹配其前的原子
? 0次或1次匹配其前的原子
| 匹配兩個(gè)或多個(gè)選擇 列如 [1-9]|[a-b]|[A-Z] 與其中任何匹配為ture
^ 匹配字符串串首的原子 例如 abscd===^afdgfgf 相匹配
$ 匹配字符串串尾的原子 例如 dasdsv===v$
[] 匹配方括號中的任一原子 例如 s===[dsadas]
[^] 匹配除方括號中的原子外的任何字符 例如 aaaaa===[dddd]
{m} 表示其前原子恰好出現(xiàn)m次
{m,n} 表示其前原子至少出現(xiàn)m次,至少出現(xiàn)n次(n>m)
{m,} 表示其前原子出現(xiàn)不少于m次
() 整體表示一個(gè)原子
. 匹配除換行之外的任何一個(gè)字符
^ $ 這兩個(gè)原字符在一起稱為定界
abd===^abc$ 只有這樣才匹配
模式匹配的順序
順序 元字符 說明
1 () 模式單元
2 ?* +{} 重復(fù)匹配
3 ^$ 邊界限制
4 | 模式選擇
POSIX正則表達(dá)式函數(shù)
ereg()和eregi()
ereg_replace()和eregi_replace()
split()和spliti()
ereg()和eregi()ereg()字符串匹配函數(shù),eregi()是ereg()函數(shù)的忽略大小的版本
語法格式:if (!ereg('^[^./][^/]*$', $userfile))//不匹配格式輸出die
{
die('這是一個(gè)非法的文件名!');
}
ereg_replace()和eregi_replace(忽略大小寫)替換
string eregi_replace (“正則表達(dá)式”,“目標(biāo)替換字符”,“替換目標(biāo)”)
語法格式:$string = "This is a test";
echo str_replace(" is", " was", $string);
echo ereg_replace("( )is", "\\1was", $string);\\1 為繼承第一個(gè)整體
echo ereg_replace("(( )is)", "\\2was", $string);\\2繼承第二個(gè)整體
split()和spliti(忽略大小寫)用正則表達(dá)式將字符串分割到數(shù)組中
list:給數(shù)組中的值賦予一些變量
語法格式:$date = "04/30/1973";
list($month, $day, $year) = split ('[/.-]', $date);//列出三個(gè)變數(shù)對應(yīng)格式//以什么形式拆分 拆分誰
echo "Month: $month; Day: $day; Year: $yearbr />
";
輸出結(jié)果Month: 04; Day: 30; Year: 1973
多行匹配
$rows = file('php.ini'); //將php.ini文件讀到數(shù)組中
//循環(huán)便歷
foreach($rows as $line)
{
if(trim($line))
{
//將匹配成功的參數(shù)寫入數(shù)組中
if(eregi("^([a-z0-9_.]*) *=(.*)", $line, $matches)) //循環(huán)進(jìn)行多行匹配
{
$options[$matches[1]] = trim($matches[2]);
}
unset($matches);
}
}
//輸出參數(shù)結(jié)果
print_r($options);
PCRE正則表達(dá)式
PCRE全稱為Perl Compatible Regular Expression,意思是Perl兼容正則表達(dá)式。
在PCRE中,通常將模式表達(dá)式(即正則表達(dá)式)包含在兩個(gè)反斜線“/”之間,如“/apple/”。
元字符(Meta-character)
元字符 說明
\A 匹配字符串串首的原子
\Z 匹配字符串串尾的原子
\b 匹配單詞的邊界 /\bis/ 匹配頭為is的字符串 /is\b/ 匹配尾為is的字符串 /\bis\b/ 定界
\B 匹配除單詞邊界之外的任意字符 /\Bis/ 匹配單詞“This”中的“is”
\d 匹配一個(gè)數(shù)字;等價(jià)于[0-9]
\D 匹配除數(shù)字以外任何一個(gè)字符;等價(jià)于[^0-9]
\w 匹配一個(gè)英文字母、數(shù)字或下劃線;等價(jià)于[0-9a-zA-Z_]
\W 匹配除英文字母、數(shù)字和下劃線以外任何一個(gè)字符;等價(jià)于[^0-9a-zA-Z_]
\s 匹配一個(gè)空白字符;等價(jià)于[\f
\t\v]
\S 匹配除空白字符以外任何一個(gè)字符;等價(jià)于[^\f
\t\v]
\f 匹配一個(gè)換頁符等價(jià)于 \x0c 或 \cL
匹配一個(gè)換行符;等價(jià)于 \x0a 或 \cJ
匹配一個(gè)回車符等價(jià)于\x0d 或 \cM
\t 匹配一個(gè)制表符;等價(jià)于 \x09\或\cl
\v 匹配一個(gè)垂直制表符;等價(jià)于\x0b或\ck
\oNN 匹配一個(gè)八進(jìn)制數(shù)字
\xNN 匹配一個(gè)十六進(jìn)制數(shù)字
\cC 匹配一個(gè)控制字符
模式修正符(Pattern Modifiers)
i -可同時(shí)匹配大小寫字母
M -將字符串視為多行
S -將字符串視為單行,換行符做普通字符看待,使“.”匹配任何字符
X -模式中的空白忽略不計(jì)
U -匹配到最近的字符串
e -將替換的字符串作為表達(dá)使用
格式:/apple/i匹配“apple”或“Apple”等,忽略大小寫。 /i
PCRE的模式單元
//1 提取第一位的屬性
/^\d{2}([\W])\d{2}\\1\d{4}$匹配“12-31-2006”、“09/27/1996”、“86 01 4321”等字符串。但上述正則表達(dá)式不匹配“12/34-5678”的格式。這是因?yàn)槟J健癧\W]”的結(jié)果“/”已經(jīng)被存儲。下個(gè)位置“\1”引用時(shí),其匹配模式也是字符“/”。
當(dāng)不需要存儲匹配結(jié)果時(shí)使用非存儲模式單元“(?:)”
例如/(?:a|b|c)(D|E|F)\\1g/ 將匹配“aEEg”。在一些正則表達(dá)式中,使用非存儲模式單元是必要的。否則,需要改變其后引用的順序。上例還可以寫成/(a|b|c)(C|E|F)\2g/。
PCRE正則表達(dá)式函數(shù)
preg_match()和preg_match_all()
preg_quote()
preg_split()
preg_grep()
preg_replace()
preg_match()和preg_match_all()正則表達(dá)式的匹配
語法格式:if (preg_match ("/php/i", "PHP is the web scripting language of choice.")) {
print "A match was found.";
} else {
print "A match was not found.";
}
preg_quote()轉(zhuǎn)義正則表達(dá)式字符
語法格式:$keywords = "$40 for a g3/400";
$keywords = preg_quote ($keywords, "/");//轉(zhuǎn)義誰 /轉(zhuǎn)義符號
echo $keywords;
preg_split()用正則表達(dá)式分割字符串
preg_split()本函數(shù)與split函數(shù)功能一致。
語法格式:$keywords = preg_split ("/[\s,]+/", "hypertext language, programming");
print_r($keywords);
preg_grep()返回與模式匹配的數(shù)組單元
語法格式:$fl_array = preg_grep ("/^(\d+)?\.\d+$/", $array);
preg_replace()執(zhí)行正則表達(dá)式的搜索和替換
語法格式:
復(fù)制代碼 代碼如下:
$string = "April 15, 2003";
$pattern = "/(\w+) (\d+), (\d+)/i";
$replacement = "\${1}1,\$3";
print preg_replace($pattern, $replacement, $string);
preg_match_all()進(jìn)行全局正則表達(dá)式匹配
語法格式:
復(fù)制代碼 代碼如下:
preg_match_all ("|[^>]+>(.*)/[^>]+>|U",
"b>example: /b>div align=left>this is a test/div>",
$out, PREG_PATTERN_ORDER);
print $out[0][0].", ".$out[0][1]."
";
print $out[1][0].", ".$out[1][1]."
";
輸出結(jié)果:b>example: /b>, div align=left>this is a test/div> example: , this is a test
您可能感興趣的文章:- PHP 字符串正則替換函數(shù)preg_replace使用說明
- PHP正則替換函數(shù)preg_replace和preg_replace_callback使用總結(jié)
- php正則之函數(shù) preg_replace()參數(shù)說明
- PHP 正則表達(dá)式之正則處理函數(shù)小結(jié)(preg_match,preg_match_all,preg_replace,preg_split)
- php正則preg_replace_callback函數(shù)用法實(shí)例
- PHP正則替換函數(shù)preg_replace()報(bào)錯(cuò):Notice Use of undefined constant的解決方法分析
- PHP 正則表達(dá)式常用函數(shù)使用小結(jié)
- PHP正則表達(dá)式基本函數(shù) 修飾符 元字符和需轉(zhuǎn)義字符說明
- PHP 正則表達(dá)式常用函數(shù)
- PHP中的正則表達(dá)式函數(shù)介紹
- php 正則匹配函數(shù)體
- PHP正則表達(dá)式函數(shù)preg_replace用法實(shí)例分析