今天同事叫我編寫一個(gè)shell腳本。話說,雖然我受*nix的影響甚深,但是對(duì)于*nix 里隨處可見的sh腳本卻是討厭之極。為什么討厭呢?首先是因?yàn)閟h腳本那莫名其妙的語法,感覺就像隨寫隨扔的程序,完全沒有任何美感可言。其次是sh腳本的處理能力還是比較弱的,在文本處理、XML處理還有網(wǎng)絡(luò)編程方面,基本上都要借助于perl,awk等一堆程序。我對(duì)這些程序也是不大喜歡的,況且學(xué)習(xí)第三方軟件總要時(shí)間,還不如都用python好了。
那,python可以做shell腳本嗎? 首先介紹一個(gè)函數(shù):
os.system(command)
這個(gè)函數(shù)可以調(diào)用shell運(yùn)行命令行command并且返回它的返回值。試一下在 python的解釋器里輸入os.system(”ls -l”),就可以看到”ls”列出了當(dāng)前目錄下的文件??梢哉f,通過這個(gè)函數(shù),python就擁有了shell的所有能力。呵呵。。不過,通常這條命令不需要用到。因?yàn)閟hell常用的那些命令在python中通常有對(duì)應(yīng)而且同樣簡潔的寫法。
shell中最常用的是ls命令,python對(duì)應(yīng)的寫法是:os.listdir(dirname),這個(gè)函數(shù)返回字符串列表,里面是所有的文件名,不過不包含”.”和”..”。如果要遍歷整個(gè)目錄的話就會(huì)比較復(fù)雜一點(diǎn)。我們等下再說吧。先在解釋器里試一下:
>>> os.listdir(”/”)
['tmp', ‘misc', ‘opt', ‘root', ‘.autorelabel', 'sbin', 'srv', ‘.autofsck', ‘mnt', ‘usr', ‘var', ‘etc', 'selinux', ‘lib', ‘net', ‘lost found', 'sys', ‘media', ‘dev', ‘proc', ‘boot', ‘home', ‘bin']
就像這樣,接下去所有命令都可以在python的解釋器里直接運(yùn)行觀看結(jié)果。
對(duì)應(yīng)于cp命令的是:shutil.copy(src,dest),這個(gè)函數(shù)有兩個(gè)參數(shù),參數(shù)src是指源文件的名字,參數(shù)dest則是目標(biāo)文件或者目標(biāo)目錄的名字。 如果dest是一個(gè)目錄名,就會(huì)在那個(gè)目錄下創(chuàng)建一個(gè)相同名字的文件。與shutil.copy函數(shù)相類似的是 shutil.copy2(src,dest),不過copy2還會(huì)復(fù)制最后存取時(shí)間和最后更新時(shí)間。
不過,shell的cp命令還可以復(fù)制目錄,python的shutil.copy卻不行,第一個(gè)參數(shù)只能是一個(gè)文件。這怎么辦?其實(shí),python還有個(gè)shutil.copytree(src,dst[,symlinks]) 。參數(shù)多了一個(gè)symlinks,它是一個(gè)布爾值,如果是True的話就創(chuàng)建符號(hào)鏈接。
移動(dòng)或者重命名文件和目錄呢?估計(jì)被聰明的朋友猜到了,shutil.move(src,dst),呵呵。。與mv命令類似,如果src和dst在同一個(gè)文件系統(tǒng)上,shutil.move只是簡單改一下名字,如果src和dst在不同的文件系統(tǒng)上,shutil.move會(huì)先把src復(fù)制到dst,然后刪除src文件??吹浆F(xiàn)在,大多數(shù)朋友應(yīng)該已經(jīng)對(duì) python的能力有點(diǎn)眉目了,接下來我就列個(gè)表,介紹一下其它的函數(shù):
os.chdir(dirname)
把當(dāng)前工作目錄切換到dirname下
os.getcwd()
返回當(dāng)前的工作目錄路徑
os.chroot(dirname)
把dirname作為進(jìn)程的根目錄。和*nix下的chroot命令類似
os.chmod(path,mode)
更改path的權(quán)限位。mode可以是以下值(使用or)的組合:
os.S_ISUID
os.S_ISGID
os.S_ENFMT
os.S_ISVTX
os.S_IREAD
os.S_IWRITE
os.S_IEXEC
os.S_IRWXU
os.S_IRUSR
os.S_IWUSR
os.S_IXUSR
os.S_IRWXG
os.S_IRGRP
os.S_IWGRP
os.S_IXGRP
os.S_IRWXO
os.S_IROTH
os.S_IWOTH
os.S_IXOTH
具體它們是什么含義,就不仔細(xì)說了,基本上就是R代表讀,W代表寫,X代表執(zhí)行權(quán)限。USR 代表用戶,GRP代表組,OTH代表其它。
os.chown(path,uid,gid)
改變文件的屬主。uid和gid為-1的時(shí)候不改變?cè)瓉淼膶僦鳌?/p>
os.link(src,dst)
創(chuàng)建硬連接
os.mkdir(path,[mode])
創(chuàng)建目錄。mode的意義參見os.chmod(),默認(rèn)是0777
os.makedirs(path,[mode])
和os.mkdir()類似,不過會(huì)先創(chuàng)建不存在的父目錄。
os.readlink(path)
返回path這個(gè)符號(hào)鏈接所指向的路徑
os.remove(path)
刪除文件,不能用于刪除目錄
os.rmdir(path)
刪除文件夾,不能用于刪除文件
os.symlink(src,dst)
創(chuàng)建符號(hào)鏈接
shutil.rmtree(path[,ignore_errors[,onerror]])
刪除文件夾
介紹了這么多,其實(shí)只要查一下os和shutil兩個(gè)模塊的文檔就有了,呵呵。。真正編寫 shell腳本的時(shí)候還需要注意:
1.環(huán)境變量。python的環(huán)境變量保存在os.environ這個(gè)字典里,可以用普通字典的方法修改它,使用system啟動(dòng)其它程序的時(shí)候會(huì)自動(dòng)被繼承。比如:
os.environ[”fish”]=”nothing”
不過也要注意,環(huán)境變量的值只能是字符串。和shell有些不同的是,python沒有 export環(huán)境變量這個(gè)概念。為什么沒有呢?因?yàn)閜ython沒有必要有:-)
2.os.path這個(gè)模塊里包含了很多關(guān)于路徑名處理的函數(shù)。在shell里路徑名處理好像不是很重要,但是在python里經(jīng)常需要用到。最常用的兩個(gè)是分離和合并目錄名和文件名:
os.path.split(path) -> (dirname,basename)
這個(gè)函數(shù)會(huì)把一個(gè)路徑分離為兩部分,比如:os.path.split(”/foo /bar.dat”)會(huì)返回(”/foo”,”bar.dat”)
os.path.join(dirname,basename)
這個(gè)函數(shù)會(huì)把目錄名和文件名組合成一個(gè)完整的路徑名,比如:os.path.join(”/foo”,”bar.dat”)會(huì)返回”/foo/bar.dat”。這個(gè)函數(shù)和os.path.split()剛好相反。
還有這些函數(shù):
os.path.abspath(path)
把path轉(zhuǎn)成絕對(duì)路徑
os.path.expanduser(path)
把path中包含的”~”和”~user”轉(zhuǎn)換成用戶目錄
os.path.expandvars(path)
根據(jù)環(huán)境變量的值替換path中包含的”$name”和”${name}”,比如環(huán)境變量 FISH=nothing,那os.path.expandvars(”$FISH/abc”)會(huì)返回”nothing/abc”
os.path.normpath(path)
去掉path中包含的”.”和”..”
os.path.splitext(path)
把path分離成基本名和擴(kuò)展名。比如:os.path.splitext(”/foo /bar.tar.bz2″)返回('/foo/bar.tar', ‘.bz2′)。要注意它和os.path.split()的區(qū)別
3.在os模塊有一個(gè)很好用的函數(shù)叫os.stat()沒有介紹,因?yàn)閛s.path模塊里包含了一組和它具有同樣功能的函數(shù),但是名字更好記一點(diǎn)。
os.path.exists(path)
判斷文件或者目錄是否存在
os.path.isfile()
判斷path所指向的是否是一個(gè)普通文件,而不是目錄
os.path.isdir(path)
判斷path所指向的是否是一個(gè)目錄,而不是普通文件
os.path.islink(path)
判斷path所指向的是否是一個(gè)符號(hào)鏈接
os.path.ismount(path)
判斷path所指向的是否是一個(gè)掛接點(diǎn)(mount point)
os.path.getatime(path)
返回path所指向的文件或者目錄的最后存取時(shí)間。
os.path.getmtime(path)
返回path所指向的文件或者目錄的最后修改時(shí)間
os.path.getctime(path)
返回path所指向的文件的創(chuàng)建時(shí)間
os.path.getsize(path)
返回path所指向的文件的大小
4.應(yīng)用python編寫shell腳本經(jīng)常要用到os,shutil,glob(正則表達(dá)式的文件名),tempfile(臨時(shí)文件),pwd(操作/etc/passwd文件),grp(操作/etc/group文件),commands(取得一個(gè)命令的輸出)。前面兩個(gè)已經(jīng)基本上介紹完了,后面幾個(gè)很簡單,看一下文檔就可以了。
5.sys.argv是一個(gè)列表,保存了python程序的命令行參數(shù)。其中 sys.argv[0]是程序本身的名字。
不能光說不練,接下來我們就編寫一個(gè)用于復(fù)制文件的簡單腳本。前兩天叫我寫腳本的同事有個(gè)幾萬個(gè)文件的目錄,他想復(fù)制這些文件到其它的目錄,又不能直接復(fù)制目錄本身。他試了一下”cp src/* dest/”結(jié)果報(bào)了一個(gè)命令行太長的錯(cuò)誤,讓我?guī)退麑懸粋€(gè)腳本。操起python來:
import sys,os.path,shutil
for f in os.listdir(sys.argv[1]):
shutil.copy(os.path.join(sys.argv[1],f),sys.argv[2])
再試一下linuxapp版里的帖子——把一個(gè)文件夾下的所有文件重命名成 10001~10999??梢赃@樣寫:
import os.path,sys
dirname=sys.argv[1]
i=10001
for f in os.listdir(dirname):
src=os.path.join(dirname,f)
if os.path.isdir(src):
continue
os.rename(src,str(i))
i =1
os.chkdir(path) 轉(zhuǎn)換到目錄path 下。
os.system('md a') 可以直接創(chuàng)建目錄。
os.name字符串指示你正在使用的平臺(tái)。比如對(duì)于Windows,它是'nt',而對(duì)于Linux/Unix用戶,它是'posix'。
● os.getcwd()函數(shù)得到當(dāng)前工作目錄,即當(dāng)前Python腳本工作的目錄路徑。
● os.getenv()和os.putenv()函數(shù)分別用來讀取和設(shè)置環(huán)境變量。
● os.listdir()返回指定目錄下的所有文件和目錄名。
● os.remove()函數(shù)用來刪除一個(gè)文件。
● os.system()函數(shù)用來運(yùn)行shell命令。
● os.linesep字符串給出當(dāng)前平臺(tái)使用的行終止符。例如,Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'。
● os.path.split()函數(shù)返回一個(gè)路徑的目錄名和文件名。
>>> os.path.split('/home/swaroop/byte/code/poem.txt')
('/home/swaroop/byte/code', 'poem.txt')
● os.path.isfile()和os.path.isdir()函數(shù)分別檢驗(yàn)給出的路徑是一個(gè)文件還是目錄。類似地,os.path.exists()函數(shù)用來檢驗(yàn)給出的路徑是否真地存在。
文件重定向
已有PY文件new1.py ,在命令行下輸入:new1>new.txt 可以將new1運(yùn)行的結(jié)果輸出到文件new.txt,這稱為流重定向。