99re在线国产,久久国产精品99久久久久久小说 ,国产激情婬妇A片视频

主頁(yè) > 知識(shí)庫(kù) > JAVA中正則表達(dá)式小總結(jié)(整理)

JAVA中正則表達(dá)式小總結(jié)(整理)

]js正則表達(dá)式基本語(yǔ)法(精粹)： https://www.jb51.net/article/72044.htm

許多語(yǔ)言，包括Perl、PHP、Python、JavaScript和JScript，都支持用正則表達(dá)式處理文本，一些文本編輯器用正則表達(dá)式實(shí)現(xiàn)高級(jí)“搜索-替換”功能。所以JAVA語(yǔ)言也不例外。正則表達(dá)式已經(jīng)超出了某種語(yǔ)言或某個(gè)系統(tǒng)的局限，成為被人們廣為使用的工具，我們完全可以用它來(lái)解決實(shí)際開(kāi)發(fā)中碰到的一些實(shí)際的問(wèn)題。

在JDK1.3及之前的JDK版本中并沒(méi)有包含正則表達(dá)式的類(lèi)，如果要在Java中使用正則表達(dá)式必須使用第三方提供的正則表達(dá)式庫(kù)，最有名的就是Jakarta-ORO，Jakarta-ORO庫(kù)以前叫做OROMatcher，是Daniel Savarese贈(zèng)送給Jakarta Project的一個(gè)開(kāi)源包。使用的時(shí)候首先要?jiǎng)?chuàng)建一個(gè)實(shí)現(xiàn)了PatternCompiler接口的實(shí)例變量以創(chuàng)建一個(gè)“模式編譯器”，Jakarta-ORO中實(shí)現(xiàn)了這個(gè)接口的類(lèi)就是Perl5Compiler，這個(gè)類(lèi)做到了與Perl5的正則表達(dá)式完全兼容。Jakarta-ORO的使用是非常簡(jiǎn)便的，而且效率非常高，支持的正則表達(dá)式語(yǔ)法也是非常全的，唯一的缺點(diǎn)就是它不是JDK中的標(biāo)準(zhǔn)包。從JDK1.4開(kāi)始提供了支持正則表達(dá)式API，它們位于java.util.regex包中，由于已經(jīng)有了標(biāo)準(zhǔn)API，所以本書(shū)將會(huì)用java.util.regex進(jìn)行正則表達(dá)式的相關(guān)操作。

一、正則表達(dá)式基礎(chǔ)知識(shí)

1.1 句點(diǎn)符號(hào)

假設(shè)你在玩英文拼字游戲，想要找出三個(gè)字母的單詞，而且這些單詞必須以“t”字母開(kāi)頭，以“n”字母結(jié)束。另外，假設(shè)有一本英文字典，你可以用正則表達(dá)式搜索它的全部?jī)?nèi)容。要構(gòu)造出這個(gè)正則表達(dá)式，你可以使用一個(gè)通配符——句點(diǎn)符號(hào)“.”。這樣，完整的表達(dá)式就是“t.n”，它匹配“tan”、“ten”、“tin”和“ton”，還匹配“t#n”、“tpn”甚至“t n”，還有其他許多無(wú)意義的組合。這是因?yàn)榫潼c(diǎn)符號(hào)匹配所有字符，包括空格、Tab字符甚至換行符：

1.2 方括號(hào)符號(hào)

為了解決句點(diǎn)符號(hào)匹配范圍過(guò)于廣泛這一問(wèn)題，你可以在方括號(hào)（“[]”）里面指定看來(lái)有意義的字符。此時(shí)，只有方括號(hào)里面指定的字符才參與匹配。也就是說(shuō)，正則表達(dá)式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”。但“Toon”不匹配，因?yàn)樵诜嚼ㄌ?hào)之內(nèi)你只能匹配單

個(gè)字符：

1.3 “或”符號(hào)

如果除了上面匹配的所有單詞之外，你還想要匹配“toon”，那么，你可以使用“|”操作符?！皘”操作符的基本意義就是“或”運(yùn)算。要匹配“toon”，使用“t(a|e|i|o|oo)n”正則表達(dá)式。這里不能使用方擴(kuò)號(hào)，因?yàn)榉嚼ㄌ?hào)只允許匹配單個(gè)字符；這里必須使用圓括號(hào)“()”。圓括號(hào)還可以用來(lái)分組。

1.4 表示匹配次數(shù)的符號(hào)

下表顯示了正則表達(dá)式的語(yǔ)法：

表 1.1 正則表達(dá)式語(yǔ)法

假設(shè)我們要在文本文件中搜索美國(guó)的社會(huì)安全號(hào)碼。這個(gè)號(hào)碼的格式是999-99-9999。用來(lái)匹配它的正則表達(dá)式如圖一所示。在正則表達(dá)式中，連字符（“-”）有著特殊的意義，它表示一個(gè)范圍，比如從0到9。因此，匹配社會(huì)安全號(hào)碼中的連字符號(hào)時(shí)，它的前面要加上一個(gè)轉(zhuǎn)義字符“/”。

假設(shè)進(jìn)行搜索的時(shí)候，你希望連字符號(hào)可以出現(xiàn)，也可以不出現(xiàn)——即，999-99-9999和999999999都屬于正確的格式。這時(shí)，你可以在連字符號(hào)后面加上“？”數(shù)量限定符號(hào)。

美國(guó)汽車(chē)牌照的一種格式是四個(gè)數(shù)字加上二個(gè)字母。它的正則表達(dá)式前面是數(shù)字部分“[0-9]{4}”，再加上字母部分“[A-Z]{2}”。

1.5 “否”符號(hào)

“^”符號(hào)稱(chēng)為“否”符號(hào)。如果用在方括號(hào)內(nèi)，“^”表示不想要匹配的字符。例如，圖四的正則表達(dá)式匹配所有單詞，但以“X”字母開(kāi)頭的單詞除外。

1.6 圓括號(hào)和空白符號(hào)

“/s”符號(hào)是空白符號(hào)，匹配所有的空白字符，包括Tab字符。如果字符串正確匹配，接下來(lái)如何提取出月份部分呢？只需在月份周?chē)由弦粋€(gè)圓括號(hào)創(chuàng)建一個(gè)組，然后用ORO API提取出它的值。

1.7 其它符號(hào)

為簡(jiǎn)便起見(jiàn)，你可以使用一些為常見(jiàn)正則表達(dá)式創(chuàng)建的快捷符號(hào)。如以下所示：

/t：制表符，等同于/u0009
/n：換行符，等同于/u000A
/d：代表一個(gè)數(shù)字，等同于[0-9]
/D：代表非數(shù)字，等同于[^0-9]
/s：代表?yè)Q行符、Tab制表符等空白字符
/S：代表非空白字符
/w：字母字符，等同于[a-zA-Z_0-9]
/W：非字母字符，等同于[^/w]

例如，在前面社會(huì)安全號(hào)碼的例子中，所有出現(xiàn)“[0-9]”的地方我們都可以使用“/d”。

以下是我整理出來(lái)的程序：供參考：

package org.luosijin.test; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
/** 
 * 正則表達(dá)式 
 * @version V. 
 * @author 羅嗣金 
 * @date -- 
 */ 
public class Regex { 
 /** 
 * @param args 
 * @author 羅嗣金 
 * @date -- 下午:: 
 */ 
 public static void main(String[] args) { 
 Pattern pattern = Pattern.compile("b*g"); 
 Matcher matcher = pattern.matcher("bbg"); 
 System.out.println(matcher.matches()); 
 System.out.println(pattern.matches("b*g","bbg")); 
 //驗(yàn)證郵政編碼 
 System.out.println(pattern.matches("{}", "")); 
 System.out.println(pattern.matches("http://d{}", "")); 
 //驗(yàn)證電話(huà)號(hào)碼 
 System.out.println(pattern.matches("{,}//-?+", "")); 
 getDate("Nov ,"); 
 charReplace(); 
 //驗(yàn)證身份證:判斷一個(gè)字符串是不是身份證號(hào)碼，即是否是或位數(shù)字。 
 System.out.println(pattern.matches("^//d{}|//d{}$", "")); 
 getString("D:/dir/test.txt"); 
 getChinese("welcome to china,江西奉新,welcome,你!"); 
 validateEmail("luosijin@.com"); 
 } 
 /** 
 * 日期提取:提取出月份來(lái) 
 * @param str 
 * @author 羅嗣金 
 * @date -- 下午:: 
 */ 
 public static void getDate(String str){ 
 String regEx="([a-zA-Z]+)|//s+{,},//s*{}"; 
 Pattern pattern = Pattern.compile(regEx); 
 Matcher matcher = pattern.matcher(str); 
 if(!matcher.find()){ 
  System.out.println("日期格式錯(cuò)誤!"); 
  return; 
 } 
 System.out.println(matcher.group()); //分組的索引值是從開(kāi)始的，所以取第一個(gè)分組的方法是m.group()而不是m.group()。 
 } 
 /** 
 * 字符替換:本實(shí)例為將一個(gè)字符串中所有包含一個(gè)或多個(gè)連續(xù)的“a”的地方都替換成“A”。 
 * 
 * @author 羅嗣金 
 * @date -- 上午:: 
 */ 
 public static void charReplace(){ 
 String regex = "a+"; 
 Pattern pattern = Pattern.compile(regex); 
 Matcher matcher = pattern.matcher("okaaaa LetmeAseeaaa aa booa"); 
 String s = matcher.replaceAll("A"); 
 System.out.println(s); 
 } 
 /** 
 * 字符串提取 
 * @param str 
 * @author 羅嗣金 
 * @date -- 上午:: 
 */ 
 public static void getString(String str){ 
 String regex = ".+/(.+)$"; 
 Pattern pattern = Pattern.compile(regex); 
 Matcher matcher = pattern.matcher(str); 
 if(!matcher.find()){ 
  System.out.println("文件路徑格式不正確！"); 
  return; 
 } 
 System.out.println(matcher.group()); 
 } 
 /** 
 * 中文提取 
 * @param str 
 * @author 羅嗣金 
 * @date -- 上午:: 
 */ 
 public static void getChinese(String str){ 
 String regex = "[//uE-//uFFF]+";//[//uE-//uFFF]為漢字 
 Pattern pattern = Pattern.compile(regex); 
 Matcher matcher = pattern.matcher(str); 
 StringBuffer sb = new StringBuffer(); 
 while(matcher.find()){ 
  sb.append(matcher.group()); 
 } 
 System.out.println(sb); 
 } 
 /** 
 * 驗(yàn)證Email 
 * @param email 
 * @author 羅嗣金 
 * @date -- 上午:: 
 */ 
 public static void validateEmail(String email){ 
 String regex = "[-a-zA-Z]+@[-a-zA-Z]+//.[-a-zA-Z]+"; 
 Pattern pattern = Pattern.compile(regex); 
 Matcher matcher = pattern.matcher(email); 
 if(matcher.matches()){ 
  System.out.println("這是合法的Email"); 
 }else{ 
  System.out.println("這是非法的Email"); 
 } 
 } 
}

您可能感興趣的文章:

Java正則表達(dá)式實(shí)現(xiàn)經(jīng)緯度的合法性操作

標(biāo)簽：泰州長(zhǎng)沙宣城重慶西安無(wú)錫綿陽(yáng) 銅川

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《JAVA中正則表達(dá)式小總結(jié)(整理)》，本文關(guān)鍵詞 JAVA,中,正則,表達(dá)式,小,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。