主頁 > 知識庫 > Ruby程序中正則表達式的基本使用教程

Ruby程序中正則表達式的基本使用教程

熱門標(biāo)簽:白銀外呼paas系統(tǒng) 百度地圖標(biāo)注自定義圖片 高德地圖標(biāo)注客服 滴滴外呼系統(tǒng) 地圖標(biāo)注賺錢項目注冊 電銷機器人廠商代理 湖州u友防封電銷卡 常德電銷平臺外呼系統(tǒng)軟件價格 徐州網(wǎng)絡(luò)外呼系統(tǒng)哪個好

Ruby大部分的內(nèi)置類型都和其它的編程語言很相似。主要有strings,integers,floats,arrays等等。然而,只有腳本語言,如Ruby,Perl,和awk等提供了內(nèi)置表達式類型的支持。正則表達式盡管比較隱蔽,但卻是一個很強大的文本處理工具。

正則表達式是使用指定的模式匹配字符串的一種簡單的方法。在Ruby中,創(chuàng)建正則表達式的典型方式是把模式寫在兩個斜線之間/pattern/。

畢竟,Ruby就是Ruby,正則表達式也是對象,也能像對象般操作。

例如,你可以使用下面的正則表達式寫一個模式,它匹配一個字符串中包含有Perl或Python。

!--more-->

/Perl|Python/

在正斜線體內(nèi),是兩個我們要匹配的字符串,它們使用"|"分隔。這個管道符的意思是"左邊的或者右邊的",在這個模式中是Perl或者Python。

你還可以在模式中使用括號,就像是在算術(shù)表達式中使用的那樣,因此這個模式還可以寫成

/P(erl|ython)/

你還可以在模式中指定重復(fù)。例如加號,/ab+c/匹配字符串中一個a后面有一個或多個b然后跟著是一個c。把加號換成星號,/ab*c/創(chuàng)建的正則表達式是匹配一個a后面跟著0個或多個b然后跟著是一個c。

你還可以在模式中匹配一組字符。常用的字符類型例子有\(zhòng)s,它匹配一個空白字符(space,tab,換行符,等等);\d匹配任意數(shù)字;\w匹配任意的典型單詞字符。句號(.)匹配(基本上)任意字符。

我們把所有這些組合起來,做成實用的正則表達式。

/\d\d:\d\d:\d\d/ # a time such as 12:34:56
/Perl.*Python/  # Perl, zero or more other chars, then Python
/Perl Python/  # Perl, a space, and Python
/Perl *Python/  # Perl, zero or more spaces, and Python
/Perl +Python/  # Perl, one or more spaces, and Python
/Perl\s+Python/ # Perl, whitespace characters, then Python
/Ruby (Perl|Python)/ # Ruby, a space, and either Perl or Python

一但創(chuàng)建了一個模式,不能使用它是件很郁悶的事情。匹配操作符=~用來對一個字符串進行正則表達式匹配。如果匹配成功,=~返回第一次匹配成功的位置,否則它返回nil。也就是說,你可以在if和while的條件聲明中使用正則表達式。例如下面的代碼片段,

如果字符串中包含有文本Perl或Python時,輸出一條信息。

puts "Scripting language mentioned: #{line}" if line =~ /Perl|Python/

你能使用Ruby替換所有出現(xiàn)有Perl和Python的地方。

line.gsub(/Perl|Python/, 'Ruby')

從iHower的Ruby on Rails實戰(zhàn)圣經(jīng)中摘一個示例,用正則表達式抓取手機號碼:

phone = "139-1234-5678"
if phone =~ /(\d{3})-(\d{4})-(\d{4})/
 start_with = $1
 mid_num = $2
 end_as = $3
end

一般規(guī)則(為正常顯示,都放在代碼塊內(nèi))

  • /a/匹配字符a。   
  • /\&;/匹配特殊字符?。特殊字符包括^, $, ? , ., /, \, [, ], {, }, (, ), +, *.   
  • .匹配任意字符,例如/a./匹配ab和ac。   
  • /[ab]c/匹配ac和bc,[]之間代表范圍。例如:/[a-z]/ , /[a-zA-Z0-9]/。   
  • /[^a-zA-Z0-9]/匹配不在該范圍內(nèi)的字符串。   
  • /[\d]/代表任意數(shù)字
  • /[\w]/代表任意字母,數(shù)字或者_
  • /[\s]/代表空白字符,包括空格,TAB和換行。   
  • /[\D]/,/[\W]/,/[\S]/均為上述的否定情況。

高級規(guī)則

  • ?代表0或1個字符。/Mrs?\.?/匹配"Mr","Mrs","Mr.","Mrs."。
  • *代表0或多個字符。/Hello*/匹配"Hello","HelloJack"。
  • +代表1或多個字符。/a+c/匹配:"abc","abbdrec"等等。
  • /d{3}/匹配3個數(shù)字。
  • /d{1,10}/匹配1-10個數(shù)字。
  • /d{3,}/匹配3個數(shù)字以上。
  • /([A-Z]\d){5}/匹配首位是大寫字母,后面4個是數(shù)字的字符串。

正則表達式操作

String和RegExp均支持=~和match兩個查詢匹配方法:

puts "I can say my name" =~ /name/ #-> 13

a = /name/.match("I can say my name, my name I can say") #-> a is MatchData
puts a[0] #-> name

可以看出,如果能夠匹配,=~返回匹配的字符串位置,而match返回一個MatchData對象。如果不匹配,則返回nil。MatchData可以取出其中符合各個子匹配(或子模式)的內(nèi)容,看下面的例子:

b1=/[A-Za-z]+,[A-Za-z]+,Mrs?\./.match("Jack,Wang,Mrs., nice person")
puts b1[0] #-> Jack,Wang,Mrs

b2=/(([A-Za-z]+),([A-Za-z]+)),Mrs?\./.match("Jack,Wang,Mrs., nice person:)
puts b2[0] #-> Jack,Wang,Mrs
puts b2[1] #-> Jack,Wang
puts b2[2] #-> Jack
puts b2[3] #-> Wang

m[0]返回匹配匹配主表達式的字符串,下面的方法是等同的:m[n]==m.captures[n]

Ruby也自動的為我們填寫一些全局變量,它們以數(shù)字做名,$1, $2, 等等,$1包含的是正則表達式中從左側(cè)開始的第一對小括號內(nèi)的子模式所匹配的字符串,以此類推。我們看出匹配時,是從外到內(nèi),從左到右的順序。

貪婪量詞和不貪婪量詞

量詞*(表示零個或多個)和+(表示一個或多個)是貪婪的,它們會匹配盡可能多的字符,我們可以在*和+后面加一個?,使它成為非貪婪量詞:

下面代碼是: 1個或多個字符后接一個感嘆號。

teststr="abcd!efg!"
match=/.+!/.match(teststr)
puts match[0] #-> abcd!efg!

limitmatch=/.+?!/.match(teststr)
puts limitmatch[0] #-> abcd!

錨是指必須滿座一定的條件,才能繼續(xù)匹配:

  • ^     行首
  • $     行尾
  • \A    字符串的開始
  • \z    字符串的結(jié)尾
  • \Z    字符串的結(jié)尾(不包括最后的換行符)
  • \b    單詞邊界
c=/\b\w+\b/.match("!!Stephen**")

puts c[0] #-> Stephen

前視斷言

前視斷言表示想要知道下一個指定的是什么,但并不匹配

肯定的前視斷言 (?=)
假設(shè)我們想要匹配一個數(shù)的序列,該序列以一個圓點結(jié)束,但并不想把圓點作為模式匹配的一部分

teststr="123 456 789. 012"
m=/\d+(?=\.)/.match(teststr)
puts m[0] #-> 789

否定的前視斷言 (?!)
上例,如果/\d+(?=\.)/改為/\d+(?!\.)/,則puts m[0]輸出顯示為 123 。

修飾語

修飾語位于正則表達式最結(jié)束正則表達式的正斜杠的后面

1.i使正則表達式對大小寫不敏感
例如,/abc/i可以匹配Abc,abc,ABC等。

2.m使得正則表達式可以和任何字符匹配,包括換行符,通常情況下圓點通配符不匹配換行符。
字符串與正則表達式的相互轉(zhuǎn)換

字符串內(nèi)插進正則表達式

teststr="a.c"
re=/#{Regexp.escape(teststr)}/
puts re.match("a.c")[0] #-> a.c
test=re.match("abc")
puts test[0] #-> Nil

正則表達式轉(zhuǎn)換成字符串

puts /abc/.inspect #-> /abc/

使用正則表達式的常見方法:

  • 用于if和while等
  • 用于gsub、grep等
  • 用于find_all、scan等

例如,puts "test 1 2 and test 3 4".scan(/\d/)會輸出["1","2","3","4"]。

您可能感興趣的文章:
  • 詳解Ruby中正則表達式對字符串的匹配和替換操作
  • 淺析Ruby中的正則表達式的使用
  • Ruby中使用正則表達式的基礎(chǔ)指引
  • 舉例初步講解Ruby中的正則表達式
  • 詳細(xì)介紹Ruby中的正則表達式
  • 使用Ruby re模塊創(chuàng)建復(fù)雜的正則表達式
  • ruby 正則表達式 教程
  • ruby 正則表達式詳解及示例代碼

標(biāo)簽:永州 張家界 梧州 遼寧 三沙 公主嶺 普洱 荊門

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Ruby程序中正則表達式的基本使用教程》,本文關(guān)鍵詞  Ruby,程序,中,正則,表達式,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Ruby程序中正則表達式的基本使用教程》相關(guān)的同類信息!
  • 本頁收集關(guān)于Ruby程序中正則表達式的基本使用教程的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章