正則表達(dá)式貪婪匹配模式,對(duì)于初學(xué)者,往往也很容易出錯(cuò)。有時(shí)候需要匹配一個(gè)段代碼內(nèi)容,發(fā)現(xiàn)匹配與想要不一致。發(fā)現(xiàn)原來(lái),跟貪婪模式有關(guān)系。如下,我們看下例子:
什么是貪婪模式
字符串有: “h3>abd/h3>h3>bcd/h3>”,我們想匹配h3>…/h3>內(nèi)容,正則表達(dá)式如下:
1、h3開頭與結(jié)尾,”h3>待添加/h3>” h3>/h3>都作為普通字符
2、中間可以出現(xiàn)任意字符,個(gè)數(shù)可以是0個(gè)或者多個(gè),正則表達(dá)式可以用:.* ,“.”代表任意字符,默認(rèn)模式不匹配換行,”*” 重復(fù)前面字符0個(gè)或者多個(gè)。
3、最終我們考慮結(jié)果將是:”h3>.*/h3>” ,也可以是:”h3>.{0,}/h3>” {}代表,重復(fù)前面指定個(gè)數(shù)字符,以下用到是,正則表達(dá)式調(diào)試工具截圖,軟件可以看:正則表達(dá)式工具推薦(學(xué)習(xí)工具、測(cè)試工具)
2種結(jié)果都一樣,這是我們不希望得到的,我們希望從左邊開始,第一個(gè)出現(xiàn)/h3>,就開始匹配。以上這種模式,是貪婪模式,也是正則表達(dá)式默認(rèn)以這個(gè)方法匹配。表示重復(fù)字符,操作符,默認(rèn)都是貪婪模式,如:.*,.+,.{1,},.{0,} 都會(huì)匹配最大長(zhǎng)度字符。正則表達(dá)式元字符,量詞默認(rèn)首先最大匹配字符串,這些量詞有:+,*,?,{m,n} 。一開始匹配,就直接匹配到最長(zhǎng)字符串。
什么是懶惰模式
既然上面幾種,表示字符重復(fù)個(gè)數(shù),元字符默認(rèn)都是貪婪模式。如果,我們需要最小長(zhǎng)度匹配,也就是懶惰模式,怎么樣寫正則表達(dá)式呢?其實(shí),正則表達(dá)式里面通用方法是,在表示重復(fù)字符元字符,后面加多一個(gè)”?”字符即可。上面正則表達(dá)式可以寫成:”h3>.*?/h3>”,或者”h3>.{0,}?/h3>” 都可以。
懶惰模式,就匹配到我們需要字符串了。
總結(jié):正則表達(dá)式,表示字符串重復(fù)個(gè)數(shù)元字符,'?,+,*,{}' 默認(rèn)都會(huì)選擇貪婪模式,會(huì)最大長(zhǎng)度匹配字符串,而要切換到懶惰模式,就只是在該元字符,后面加多一個(gè)”?” 即可切換到非貪婪模式(懶惰模式)。
您可能感興趣的文章:- 正則表達(dá)式之 貪婪與非貪婪模式詳解(概述)
- 小議正則表達(dá)式效率 貪婪、非貪婪與回溯
- 淺談php正則表達(dá)式中的非貪婪模式匹配的使用
- [正則表達(dá)式]貪婪模式與非貪婪模式
- 正則表達(dá)式量詞與貪婪的使用詳解