字符編碼(英語:Character encoding)、字集碼是把字符集中的字符編碼為指定集合中某一對象(例如:比特模式、自然數(shù)序列、8位組或者電脈沖),以便文本在計(jì)算機(jī)中存儲和通過通信網(wǎng)絡(luò)的傳遞。常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII。其中,ASCII將字母、數(shù)字和其它符號編號,并用7比特的二進(jìn)制來表示這個(gè)整數(shù)。通常會額外使用一個(gè)擴(kuò)充的比特,以便于以1個(gè)字節(jié)的方式存儲。
1、查看文件字符編碼
###using file command###
[root@ipython report]# file --mime-encoding analysis.csv
analysis.csv: utf-8
###using vim command###
[root@ipython report]# vim analysis.csv
:set fileencoding
fileencoding=utf-8
2、設(shè)置文件字符編碼
####using iconv command####
syntax:
iconv -f old_encoding -t new_encoding filename
###example###
[root@ipython report]# iconv -f utf-8 -t gbk analysis.csv > new_analysis.csv
###using vim command###
:set fileencoding=gbk
:wq!