grep(Globel Search Regular Expression and Printing out the line)全面搜索正則表達(dá)式并把行打印出來)是一種強(qiáng)大的文本搜索工具,是一個對行進(jìn)行操作的搜索工作,它能使用正則表達(dá)式搜索文本,并把匹配的行打印出來。Unix的grep家族包括grep、egrep和fgrep。 egrep表示擴(kuò)展的grep,相比grep支持更多的元字符,"grep -E"相當(dāng)于egrep。fgrep是fast grep,不支持元字符,但是搜索速度更快。grep搜索的結(jié)果被送到屏幕,不影響原文件內(nèi)容。
1、grep的語法[] (man grep查看grep的幫助文檔)
grep [options] 'pattern' FILE
命令 選項(xiàng) 模式 文件
grep不加引號直接過濾字符串;grep在進(jìn)行模式匹配的時候必須加引號,單引和雙引號都可以;grep在引用變量的時候必須加雙引號
2、grep的選項(xiàng)[option]
-r:遞歸的搜索
-v:反向選取,只顯示不符合模式的行
-o:只顯示被模式匹配到的字符串,而不是整個行
-i:匹配時不區(qū)分大小寫
-A #:顯示匹配到的行時,順便顯示后面的#行(#表示數(shù)值)
-B #:前面的#行
-C #:前后的#行
-E:使用擴(kuò)展的正則表達(dá)式
eg:grep選項(xiàng)的例子
cat > eg1.text EOF
This is first
how are you
How old are you
fine,thanks
what,so what
What is your name
EOF
grep "you" eg1.text
grep -o "you" eg1.text
grep -v "you" eg1.text
grep -i "what" eg1.text
grep -A 1 "fine" eg1.text
grep -B 1 "fine" eg1.text
grep -C 1 "fine" eg1.text
以上代碼直接粘貼復(fù)制在linux上可直接運(yùn)行,代碼解釋運(yùn)行效果,如下
3、 正則表達(dá)式(man regex)是指一個用來描述或者匹配一系列符合某個句法規(guī)則的字符串的單個字符串,通常被用來檢索或替換那些符合某個
模式的文本內(nèi)容。正則表達(dá)式分為:基本正則表達(dá)式和擴(kuò)展正則表達(dá)式。
元字符就是指那些在正則表達(dá)式中具有特殊意義的專用字符。
grep支持基本正則表達(dá)式的元字符:
^:錨點(diǎn)行首的符合條件的內(nèi)容,用法格式"^pattern"
$:錨點(diǎn)行首的符合條件的內(nèi)容,用法格式"pattern$"
^$:匹配空白行
.:匹配任意單個字符
*:匹配緊挨在前面的字符任意次(0,1,多次)
.*:匹配任意長度的任意字符
\?:匹配緊挨在前面的字符0次或1次
\{m,n\}:匹配其前面的字符至少m次,至多n次
\{m,\}:匹配其前面的字符至少m次
\{m\}:精確匹配前面的m次
\{0,n\}:0到n次
\:錨點(diǎn)詞首----相當(dāng)于\b,用法格式:\pattern
\&;:錨點(diǎn)詞尾,用法格式:\&;pattern
\pattern\&;:單詞錨點(diǎn)
\(\):分組,用法格式:\(pattern\),引用第一個小括號的分組\1,第二個是\2,以此類推
[]:匹配指定范圍內(nèi)的任意單個字符
[^]:匹配指定范圍外的任意單個字符
eg:基本正則表達(dá)的例子
(1)、顯示/proc/meminfo文件中以不區(qū)分大小的s開頭的行;
grep "^[sS]" /proc/meminfo
(2)、顯示/etc/passwd中以nologin結(jié)尾的行;
grep "nologin$" /etc/passwd
(3)、顯示/etc/inittab中空格開頭的行;
grep "^$" /etc/inittab
(4)、顯示/etc/passwd中,以r開頭的字符而后跟了任意單個字符的行;
grep --color "^r." /etc/passwd
(5)、顯示/etc/passwd中,以r開頭后跟了o,o出現(xiàn)任意次的行;
grep --color "^ro*" /etc/passwd
(6)、顯示/etc/passwd文件中,r后跟了任意長度任意字符后跟了h的行;
grep --color "r.*h" /etc/passwd
(7)、顯示/etc/passwd中,r后跟了o,o出現(xiàn)0次或者1次的行;
grep --color "ro\?" /etc/passwd
(8)、顯示/etc/passwd中,r后跟了o,o出現(xiàn)至少1次至多2次的行;
grep --color "ro\{1,2\}" /etc/passwd
(9)、顯示/etc/passwd中,r后跟了o,o只出現(xiàn)2次的行;
grep --color "ro\{2\}" /etc/passwd
(10)、顯示/etc/passwd中,匹配root這個單詞的行;
grep --color "\root\&;" /etc/passwd
grep支持?jǐn)U展表達(dá)式的元字符:支持所有基本正則表達(dá)式的元字符,有些和基本元字符在用法上不一樣,擴(kuò)展正則表達(dá)式的命令egrep或者grep -E
?:匹配緊挨在前面的字符0次或1次
{m,n}:至少m次,至多n次
():分組
+:至少匹配前面的字符一次
a|b:匹配a或者b
eg:擴(kuò)展正則表達(dá)式的例子
(1)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)0次或者1次的行;
egrep --color "ro?" /etc/passwd
(2)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)至少1次至多2次的行;
egrep --color "ro{1,2}" /etc/passwd
(3)、顯示/etc/inittab文件中以一個數(shù)字開頭并以一個與開頭數(shù)字相同的數(shù)字結(jié)尾的;
egrep --color "^([0-9]).*\1$" /etc/inittab
(4)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)至少1次;
egrep --color "ro+" /etc/passwd
grep -E --color "ro{1,}" /etc/passwd
(5)、顯示/etc/passwd中,匹配root或者h(yuǎn)alt的行;
egrep --color "root|halt" /etc/passwd
(6)、顯示/var/log/secure文件中包含"LOGIN ON"或者"Failed passwd"的行;
egrep --color "(LOGIN ON|Failed passwd)" /var/log/secure
grep支持字符和字符集合
\d:數(shù)字字符匹配。等效于 [0-9]。
\s:匹配任何空白字符,包括空格、制表符、換頁符等。與 [ \f\n\r\t\v] 等效。
\S:匹配任何非空白字符。與 [^ \f\n\r\t\v] 等效
\w:匹配任何字類字符,包括下劃線。與“[A-Za-z0-9_]”等效。
\W:與任何非單詞字符匹配。與“[^A-Za-z0-9_]”等效。
[:digit:]:所有數(shù)字, 相當(dāng)于0-9 或者\(yùn)d
[:lower:]:所有的小寫字母
[:upper:]:所有的大寫字母
[:alpha:]:所有的字母
[:alnum:]:相當(dāng)于[0-9a-zA-Z]
[:space:]:空白字符 相當(dāng)于\s
[:punct:]:所有標(biāo)點(diǎn)符號
eg:支持字符集合的例子
(1)、顯示/etc/rc.d/rc.sysinit中以#開頭,且后面跟一個或多個空白字符,而后又跟了任意非空白字符的行;
grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/rc.d/rc.sysinit
grep -E "^#\s{1,}\S" /etc/rc.d/rc.sysinit
(2)、顯示/etc/inittab中包含了:一個數(shù)字:(即兩個冒號中間一個數(shù)字)的行;
grep --color ":[[:digit:]]:" /etc/inittab
grep --color ":\d:" /etc/inittab
經(jīng)典的例子
(1)、分組的例子
cat > test.txt EOF
He like his liker
He love his lover
She love her lover
She like her lover
EOF
grep "l..e.*l..er" test.txt
grep "\(l..e\).*\1r" test.txt
(2)、匹配1-255的數(shù)字
cat > num.txt EOF
12
234
255
256
EOF
grep --color -E "\([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\&;" num.txt
(3)、匹配ABC類IP地址即 1.0.0.1---223.255.255.254
cat > ip.txt EOF
1.0.0.254
1.0.0.255
1.2.3.4
223.255.255.254
224.255.255.252
2.255.255.255
EOF
grep -E --color "\([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\&;" ip.txt
(4)、匹配Email地址:任意長度數(shù)字字母@任意長度數(shù)字字母.(com|org|net等等)
cat > email.txt EOF
5678967@qq.com
jie231@sina.cn
ken_tom@netcom.org
jerry#li@baidu.net
li@souhu.net
EOF
grep -E --color "^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$" email.txt
(5)、匹配手機(jī)號碼:手機(jī)號碼是1[3|4|5|8]后面接9位數(shù)字的
cat > tel.txt EOF
13690876890
12589098379
15608764083
15820974619
138074082711
18618203761
19209783900
1329873909
EOF
grep --color -E "\1[3|4|5|8][0-9]{9}\&;" tel.txt
本文出自 “技術(shù)之路---桀” 博客