前言
同事把一個(gè)excel
表給我,里面的數(shù)據(jù)大概有幾千的樣子吧。自己需要把里面的數(shù)據(jù)一個(gè)一個(gè)拿出來(lái)做一個(gè)http請(qǐng)求,對(duì)得到的結(jié)果進(jìn)行過(guò)濾,然后再寫(xiě)到上面去。這是就涉及到用腳本來(lái)進(jìn)行操作了,于是自己搞了一個(gè)Java的腳本出來(lái),里面涉及到一些正則表達(dá)式,自己雖然說(shuō)會(huì),但是一直對(duì) Matcher
類(lèi)中的group
方法 不太了解。網(wǎng)上的博客也沒(méi)有寫(xiě)的特別清楚,于是有了此文。
0|1Pattern 和 Matcher
在java.util.regex 包下
- Pattern(模式類(lèi)) : 用來(lái)表達(dá)和陳述所要搜索模式的對(duì)象。Pattern.compile(pattern) pattern 也就是你寫(xiě)的正則表達(dá)式
- Matcher(匹配器類(lèi)):真正影響搜索的對(duì)象。上面Pattern.compile(pattern)得到一個(gè)Pattern對(duì)象 為 r。 r.matcher(line) line也即是你需要進(jìn)行匹配的字符串 。這樣會(huì)得到一個(gè) Matcher 的對(duì)象。
PatternSyntaxException
: 當(dāng)遇到不合法的搜索模式時(shí),會(huì)拋出例外。
0|1正則表達(dá)式語(yǔ)法
在有的語(yǔ)言中,一個(gè)反斜杠 \ 就足以具有轉(zhuǎn)義的作用,但是Java中需要兩個(gè) \\ 反斜杠。表示轉(zhuǎn)義的作用。一些字符在正則表達(dá)式中的說(shuō)明,意義。詳情可查看runoob
0|1上代碼
現(xiàn)在我的正則表達(dá)式為 (//d+)([a-z]+)(//d+)
- //d+ 表示最少匹配一個(gè)數(shù)字
- [a-z]+ 表示最少匹配一個(gè)字符
- 需要指定的字符串為 "123ra9040 123123aj234 adf12322ad 222jsk22"
- 代碼如下 :
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "123ra9040 123123aj234 adf12322ad 222jsk22";
String pattern = "(\\d+)([a-z]+)(\\d+)";
// String pattern1 = "([\\u4E00-\\u9FA5]+|\\w+)";
// 創(chuàng)建 Pattern 對(duì)象
Pattern r = Pattern.compile(pattern);
// 現(xiàn)在創(chuàng)建 matcher 對(duì)象
Matcher m = r.matcher(line);
int i = 0;
// m.find 是否找到正則表達(dá)式中符合條件的字符串
while (m.find( )) {
// 拿到上面匹配到的數(shù)據(jù)
System.out.println("----i="+i);
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) );
i++;
System.out.println("|||||||");
System.out.println("");
}
}
輸出:
----i=0
Found value: 123ra9040
Found value: 123
Found value: ra
Found value: 9040
|||||||
----i=1
Found value: 123123aj234
Found value: 123123
Found value: aj
Found value: 234
|||||||
----i=2
Found value: 222jsk22
Found value: 222
Found value: jsk
Found value: 22
|||||||
group(0) 對(duì)應(yīng)著 ((//d+)([a-z]+)(//d+)) 123ra9040
group(2) 輸出的數(shù)據(jù) 是 group(0)中所匹配的數(shù)據(jù) 也就是([a-z]+) 匹配到是數(shù)據(jù) ra
group(3) 輸出的數(shù)據(jù) 是 group(0)中所匹配的數(shù)據(jù) 也就是(//d+) 匹配到是數(shù)據(jù) 9040
0|1總結(jié)
Matcher 類(lèi)中g(shù)roup(0) 表示正則表達(dá)式中符合條件的字符串。
Matcher 類(lèi)中 group(1) 表示正則表達(dá)式中符合條件的字符串中的第一個(gè)() 中的字符串。
Matcher 類(lèi)中 group(2) 表示正則表達(dá)式中符合條件的字符串中的第二個(gè)() 中的字符串。
Matcher 類(lèi)中 group(3) 表示正則表達(dá)式中符合條件的字符串中的第三個(gè)() 中的字符串。
如果不明白,我相信看代碼會(huì)很明白的。
總結(jié)
以上所述是小編給大家介紹的正則表達(dá)式Matcher類(lèi)中g(shù)roup方法,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)歡迎給我留言,小編會(huì)及時(shí)回復(fù)大家的!
您可能感興趣的文章:- 詳解Java正則表達(dá)式中Pattern類(lèi)和Matcher類(lèi)
- Java使用正則表達(dá)式驗(yàn)證手機(jī)號(hào)和電話(huà)號(hào)碼的方法
- 使用正則表達(dá)式去除所有html標(biāo)簽只保留文字
- JS使用正則表達(dá)式獲取小括號(hào)、中括號(hào)及花括號(hào)內(nèi)容的方法示例