在篩選文本時(shí),有時(shí)你可能想根據(jù)某個(gè)給定的條件或使用一個(gè)可被匹配的特定模式,去標(biāo)記某個(gè)文件或數(shù)行字符串中的某幾行。使用 awk 來(lái)完成這個(gè)任務(wù)是非常容易的,這也正是 awk 中可能對(duì)你有所幫助的幾個(gè)功能之一。
讓我們看一看下面這個(gè)例子,比方說(shuō)你有一個(gè)寫(xiě)有你想要購(gòu)買(mǎi)的食物的購(gòu)物清單,其名稱(chēng)為 food_prices.list,它所含有的食物名稱(chēng)及相應(yīng)的價(jià)格如下所示:
$ cat food_prices.list No Item_Name Quantity Price 1 Mangoes 10 $2.45 2 Apples 20 $1.50 3 Bananas 5 $0.90 4 Pineapples 10 $3.46 5 Oranges 10 $0.78 6 Tomatoes 5 $0.55 7 Onions 5 $0.45
然后,你想使用一個(gè) (*) 符號(hào)去標(biāo)記那些單價(jià)大于 $2 的食物,那么你可以通過(guò)運(yùn)行下面的命令來(lái)達(dá)到此目的:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list
打印出單價(jià)大于 $2 的項(xiàng)目
從上面的輸出你可以看到在含有芒果和菠蘿的那行末尾都已經(jīng)有了一個(gè) (*) 標(biāo)記。假如你檢查它們的單價(jià),你可以看到它們的單價(jià)的確超過(guò)了 $2 。
在這個(gè)例子中,我們已經(jīng)使用了兩個(gè)模式:
第一個(gè)模式: / */$[2-9]/.[0-9][0-9] */ 將會(huì)得到那些含有食物單價(jià)大于 $2 的行。
第二個(gè)模式: /*/$[0-1]/.[0-9][0-9] */ 將查找那些食物單價(jià)小于 $2 的那些行。
上面的命令具體做了什么呢?這個(gè)文件有四個(gè)字段,當(dāng)模式一匹配到含有食物單價(jià)大于 $2 的行時(shí),它便會(huì)輸出所有的四個(gè)字段并在該行末尾加上一個(gè) (*) 符號(hào)來(lái)作為標(biāo)記。
第二個(gè)模式只是簡(jiǎn)單地輸出其他含有食物單價(jià)小于 $2 的行,按照它們出現(xiàn)在輸入文件 food_prices.list 中的樣子。
這樣你就可以使用模式來(lái)篩選出那些價(jià)格超過(guò) $2 的食物項(xiàng)目,盡管上面的輸出還有些問(wèn)題,帶有 (*) 符號(hào)的那些行并沒(méi)有像其他行那樣被格式化輸出,這使得輸出顯得不夠清晰。
我們?cè)?awk 系列的第二部分中也看到了同樣的問(wèn)題,但我們可以使用下面的兩種方式來(lái)解決:
1、可以像下面這樣使用 printf 命令,但這樣使用又長(zhǎng)又無(wú)聊:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4 "*" ; } / */$[0-1]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4; }' food_prices.list
使用 Awk 和 Printf 來(lái)篩選和輸出項(xiàng)目
2、 使用 $0 字段。Awk 使用變量 0 來(lái)存儲(chǔ)整個(gè)輸入行。對(duì)于上面的問(wèn)題,這種方式非常方便,并且它還簡(jiǎn)單、快速:
$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $0 "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list
使用 Awk 和變量來(lái)篩選和輸出項(xiàng)目
結(jié)論
這就是全部?jī)?nèi)容了,使用 awk 命令你便可以通過(guò)幾種簡(jiǎn)單的方法去利用模式匹配來(lái)篩選文本,幫助你在一個(gè)文件中對(duì)文本或字符串的某些行做標(biāo)記。