主頁 > 知識庫 > 在Linux系統(tǒng)中修改文本的字符編碼的方法

在Linux系統(tǒng)中修改文本的字符編碼的方法

熱門標(biāo)簽:百度地圖標(biāo)注陰影動態(tài) 淘寶系統(tǒng)退貨外呼項目考試答案 2020電銷機器人排行 貴陽語音電銷機器人招商 鹽城客服外呼系統(tǒng)軟件 北京市地圖標(biāo)注 焦作人工智能電話機器人軟件 廳外呼梯系統(tǒng)布線 鄭州營銷外呼系統(tǒng)運營商

正如我們所知道的那樣,電腦只能夠處理低級的二進制值,并不能直接處理字符。當(dāng)一個文本文件被存儲時,文件中的每一個字符都被映射成二進制值,實際存儲在硬盤中的正是這些“二進制值”。之后當(dāng)程序打開文本文件時,所有二進制值都被讀入并映射回原始的可讀字符。只有當(dāng)所有需要訪問這個文件的程序都能夠“理解”它的編碼,即二進制值到字符的映射時,這個“保存和打開”的過程才能很好地完成,這也確保了可理解數(shù)據(jù)的往返過程。

如果不同的程序使用不同的編碼來處理同一個文件,源文件中的特殊字符就無法正常顯示。這里的特殊字符指的是非英文字母的字符,例如帶重音的字符(比如 ?,á,ü)。

然后問題就來了: 1)我們?nèi)绾未_定一個確定的文本文件使用的是什么字符編碼? 2)我們?nèi)绾伟盐募D(zhuǎn)換成已選擇的字符編碼?
步驟一

為了確定文件的字符編碼,我們使用一個名為 “file” 的命令行工具。因為 file 命令是一個標(biāo)準(zhǔn)的 UNIX 程序,所以我們可以在所有現(xiàn)代的 Linux 發(fā)行版中找到它。

運行下面的命令:

   

復(fù)制代碼
代碼如下:
$ file --mime-encoding filename

    

步驟二

下一步是查看你的 Linux 系統(tǒng)所支持的文件編碼種類。為此,我們使用名為 iconv 的工具及 “-l” 選項(L 的小寫)來列出所有當(dāng)前支持的編碼。

   

復(fù)制代碼
代碼如下:
$ iconv -l

iconv 工具是 GNU libc 庫組成部分,因此它在所有 Linux 發(fā)行版中都是開箱即用的。
步驟三

在我們在我們的 Linux 系統(tǒng)所支持的編碼里面選定了目標(biāo)編碼之后,運行下面的命令來完成編碼轉(zhuǎn)換:

   

復(fù)制代碼
代碼如下:
$ iconv -f old_encoding -t new_encoding filename

例如,把 iso-8859-1 編碼轉(zhuǎn)換為 utf-8 編碼:

   

復(fù)制代碼
代碼如下:
$ iconv -f iso-8859-1 -t utf-8 input.txt

    

    了解了我們演示的如何使用這些工具之后,你可以像下面這樣修復(fù)一個受損的字幕文件:
   

標(biāo)簽:大興安嶺 青島 樂山 大慶 遼寧 大理 周口 六安

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《在Linux系統(tǒng)中修改文本的字符編碼的方法》,本文關(guān)鍵詞  在,Linux,系統(tǒng),中,修改,文本,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《在Linux系統(tǒng)中修改文本的字符編碼的方法》相關(guān)的同類信息!
  • 本頁收集關(guān)于在Linux系統(tǒng)中修改文本的字符編碼的方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章