Linux正則表達(dá)式(Regular Expression)主要遵從POSIX BRE或者POSIX ERE標(biāo)準(zhǔn)。什么是POSIX呢,POSIX Portable Operating System Interface 可移植操作系統(tǒng)接口ERE是BRE的擴(kuò)展版本,具體更強(qiáng)的處理能力,并增加了一些元字符(metacharactor)。
BRE主要的能力集有:
1) 普通字符(Literal text),如a,b,c等
2)非打印字符,包括TAB,回車,換行,回車換行(WINDOWS)
3)任意字符.
4)字符集,包括單詞型字符([[:alnum:]]),非單詞型字符([^[:alnum:]]),數(shù)字([[:digit:]]),非數(shù)字([^[:alnum:]]),空格、TAB、換行等空白字符([[:space:]])以及非空白字符([^[:space:]])
5)邊緣匹配符,不管是BRE還是ERE,都只支持匹配行首或行尾,不像perl,還可以匹配單詞首和單詞尾
6)匹配重復(fù)次數(shù)(Quantifier/Repetition)
7)分組及后向引用
8)多項(xiàng)匹配(Alteration),使用元字符|,該特性只ERE支持,BRE沒有此功能
BRE與ERE似乎對(duì)ASCII和UNICODE是否都支持尚待確認(rèn);
正前向查找和負(fù)前向查找不支持;
正后向查找和負(fù)后向查找不支持;
BRE與ERE在能力上區(qū)別僅在多項(xiàng)匹配的能力上,其他方面沒有大的差別,主要的區(qū)別體現(xiàn)在元字符上。
BRE只定義了4組元字符:
[] 用于在多個(gè)字符中選定一個(gè)字符進(jìn)行匹配,[]內(nèi)可以有-以示范圍,但-本身不是元字符
. 用于匹配任意字符
^ 用于匹配時(shí)表示“非”的含義,還有一個(gè)用法是匹配行首
$ 用于匹配行尾
ERE在此基礎(chǔ)上增加了3組元字符的定義:
{} 用于表示重復(fù)匹配的次數(shù)。BRE中只將{}當(dāng)作普通字符對(duì)待,要使用此功能必須加\進(jìn)行轉(zhuǎn)義,即“\{\}”
() 用于分組。BRE中只將()當(dāng)作普通字符對(duì)待,要使用此功能必須加\進(jìn)行轉(zhuǎn)義,即“\(\)”
| 完全為ERE新增的多項(xiàng)匹配能力定義的,BRE無多項(xiàng)匹配能力,只將|作普通字符對(duì)待
以上內(nèi)容是小編給大家介紹的Linux正則表達(dá)式特性詳解及BRE與ERE的不同,希望大家喜歡。
您可能感興趣的文章:- linux shell 路徑截取正則表達(dá)式
- 使用Linux正則表達(dá)式靈活搜索文件中的文本
- linux正則表達(dá)式awk詳解
- linux grep正則表達(dá)式與grep用法詳解
- linux shell 正則表達(dá)式(BREs,EREs,PREs)差異比較
- linux 正則表達(dá)式深度解析
- Linux 正則表達(dá)式詳解
- Linux中基本正則表達(dá)式