我們再看一個更有趣的程序.這次我們來測試一個字符串是否和一個由簡明模式(concise pattern)編碼產(chǎn)生的描述相匹配.
在這些模式(pattern)里,一些字符或字符組合都有獨特的意義,包括:
復(fù)制代碼 代碼如下:
[] 范圍描述符 (比如,[a - z] 表示在a 到 z 范圍內(nèi)的一個字母)
\w 字母或數(shù)字;相當(dāng)于 [0-9A-Za-z]
\W 非字母,數(shù)字
\s [ \t\n\r\f]空字符;相當(dāng)于 [ \t\n\r\f]
\S 非空字符
\d [0-9]數(shù)字;相當(dāng)于 [0-9]
\D 非數(shù)字字符
\b 退格符 (0x08) (僅在范圍描述符內(nèi)部時)
\b 字邊界(word boundary) (在范圍描述符外部時)
\B 非字邊界
* 前面元素出現(xiàn)0或多次
+ 前面元素出現(xiàn)1或多次
{m,n} 前面元素最少出現(xiàn)m次,最多出現(xiàn)n次
? 前面元素最多出現(xiàn)1次;相當(dāng)于 {0,1}
| 與前面或后面的表達(dá)式匹配
() 群( grouping)
那些模式中共同使用的古怪詞匯叫做正則表達(dá)式.就象Perl一樣,Ruby也用前斜杠(而不是雙引號)將它們括起來.如果你以前從未使用過正則表達(dá)式,也許它們看起來除了規(guī)則(regular)什么都不是,但花上一點兒時間了解它們是明智的.當(dāng)你需要對字符串進(jìn)行模式匹配,查找或其它操作時,它的高效的表達(dá)能力能治好你的頭痛(并節(jié)約很多行代碼).
舉個例子,設(shè)想我們想要測試一個字符串是否符合這樣的描述信息"由小寫f開頭,跟一個大寫字母,并可能跟許多非小寫字母在后面."如果你是一個老練的C程序員,大概你的頭腦里已經(jīng)裝滿幾十行程序了,對不對?承認(rèn)吧,你難以控制住自己.在Ruby里,你只需要將你的字符串用正則表達(dá)式/^f[A-Z](^[a-z])*$/檢驗一下就可以了.
那"一個由>括起來的16位數(shù)呢"?沒問題.
復(fù)制代碼 代碼如下:
ruby> def chab(s) # "contains hex in angle brackets"
| (s =~ /0(x|X)(\d|[a-f]|[A-F])+>/) != nil
| end
nil
ruby> chab "Not this one."
false
ruby> chab "Maybe this? {0x35}" # wrong kind of brackets
false
ruby> chab "Or this? 0x38z7e>" # bogus hex digit
false
ruby> chab "Okay, this: 0xfc0004>."
true
雖然,初看起來正則表達(dá)式挺讓人頭痛的,但你很快會因能夠如此高效地表達(dá)出你心中的意思而感到滿足.
下面是一個可以幫助你實驗正則表達(dá)式的小程序,把它存為regx.rb,然后在命令行里輸入'ruby regx.rb'運行.
復(fù)制代碼 代碼如下:
# Requires an ANSI terminal!
st = "\033[7m"
en = "\033[m"
while TRUE
print "str> "
STDOUT.flush
str = gets
break if not str
str.chop!
print "pat> "
STDOUT.flush
re = gets
break if not re
re.chop!
str.gsub! re, "#{st}\\#{en}"
print str, "\n"
end
print "\n"
這個小程序要求輸入兩次,一次字符串,一次正則表達(dá)式.輸入的字符串由正則表達(dá)式檢驗,然后用反視高亮度顯示所有匹配部分.先別管細(xì)節(jié),等會兒就有代碼分析.
復(fù)制代碼 代碼如下:
str> foobar
pat> ^fo+
foobar
~~~
上面紅色部分將在程序輸入中以反視表示出.下面的"~~~"行是為了方便那些使用基于字符瀏覽器的人.
我們再試幾個輸入:
str> abc012dbcd555
pat> \d
abc012dbcd555
如果讓你感到驚訝,看看本頁開頭部分的那個表格: \d與字母d無關(guān),而是對應(yīng)于單個數(shù)字.
如果有不止一種方法能匹配模式會怎樣呢?
str> foozboozer
pat> f.*z
foozboozer
~~~~~~~~
之所以foozbooz被匹配而不只是fooz,是因為一個正則表達(dá)符盡可能匹配最長的子串.
下面是一個將冒號分隔的數(shù)字時間段從字符串中隔離出來的模式匹配.
str> Wed Feb 7 08:58:04 JST 1996
pat> [0-9]+:[0-9]+(:[0-9]+)?
Wed Feb 7 08:58:04 JST 1996
"=~"是一個用于匹配正則表達(dá)式的匹配(matching)運算符;它會返回在字符串里找到的匹配的位置,或者返回 nil 表示模式無法匹配.
ruby> "abcdef" =~ /d/
3
ruby> "aaaaaa" =~ /d/
nil
您可能感興趣的文章:- Ruby程序中正則表達(dá)式的基本使用教程
- 詳解Ruby中正則表達(dá)式對字符串的匹配和替換操作
- 淺析Ruby中的正則表達(dá)式的使用
- Ruby中使用正則表達(dá)式的基礎(chǔ)指引
- 舉例初步講解Ruby中的正則表達(dá)式
- 詳細(xì)介紹Ruby中的正則表達(dá)式
- 使用Ruby re模塊創(chuàng)建復(fù)雜的正則表達(dá)式
- ruby 正則表達(dá)式詳解及示例代碼