在linux中分割大文件,比如一個5gb日志文件,需要把它分成多個小文件,分割后以利于普通的文本編輯器讀取。
有時,需要傳輸20gb的大文件到另一臺服務(wù)器,也需要把它分割成多個文件,這樣便于傳輸數(shù)據(jù)。
以下通過五個不同的例子,來講解Linux下分割大文件的方法,供大家參考。
例1、以每個文件1000行分割
split命令分割文件成每個文件1000行,并且文件名依次為 [前綴]aa, [前綴]ab, [前綴]ac等,默認(rèn)的前綴是X,每個文件的行數(shù)為1000行。
命令:
$ split mylog -l 1000
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae
例2、以每個文件20MB分割
分割文件為多個20MB的文件,附帶-b選項。
命令:
$ split -b 20M logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
例3、以每個文件50MB指定前綴分割
使用–bytes選項把文件分割成多個50MB的文件,–bytes類似-b選項,在第二個參數(shù)指定前綴。
命令:
$ split --bytes=50M logdata mydatafile
$ ls -lh
total 204M
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
例4、基于行數(shù)分割文件
使用-l選項指定行數(shù)來把文件分割成多個行數(shù)相同的文件。
命令:
$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile
例5、以數(shù)字后綴命名分割文件
使用-d選項可以指定后綴為數(shù)字,如00,01,02..,而不是aa,ab,ac。
命令:
$ split -d testfile
$ ls
testfile x00 x01 x02
可用選項
短選項 長選項 選項描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數(shù)。
-d –numeric-suffixes 使用數(shù)字作為后綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數(shù)大小。/p>
p>短選項 長選項 選項描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數(shù)。
-d –numeric-suffixes 使用數(shù)字作為后綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數(shù)大小。