主頁 > 知識庫 > utf8和unicode編碼究竟是什么關系?有何區(qū)別?

utf8和unicode編碼究竟是什么關系?有何區(qū)別?

熱門標簽:沈陽智能外呼系統(tǒng)排名 上古卷軸5地圖標注mod 武漢人工外呼系統(tǒng) 中國地圖標注各省份 移動400辦理電話 山西旅游景地圖標注 蘇州通信外呼系統(tǒng)多少錢 北川縣地圖標注 荒野大鏢客2地圖標注怎么變中文
UTF8 == Unicode Transformation Format -- 8 bit 
是Unicode傳送格式。即把Unicode文件轉換成BYTE的傳送流。 

UTF8流的轉換程序: 
Input: unsigned integer c - the code point of the character to be encoded (輸入一個unicode值) 
Output: byte b1, b2,b3, b4 - the encoded sequence of bytes (輸出四個BYTE值) 
Algorithm(算法): 
if (c0x80) 
b1 = c>>0  0x7F | 0x00 
b2 = null 
b3 = null 
b4 = null 
else if (c0x0800) 
b1 = c>>6  0x1F | 0xC0 
b2 = c>>0  0x3F | 0x80 
b3 = null 
b4 = null 
else if (c0x010000) 
b1 = c>>12  0x0F | 0xE0 
b2 = c>>6  0x3F | 0x80 
b3 = c>>0  0x3F | 0x80 
b4 = null 
else if (c0x110000) 
b1 = c>>18  0x07 | 0xF0 
b2 = c>>12  0x3F | 0x80 
b3 = c>>6  0x3F | 0x80 
b4 = c>>0  0x3F | 0x80 
end if 
===================== 
unicode 是一種編碼表格,例如,給一個漢字規(guī)定一個代碼。類似 GB2312-1980, GB18030等,只不過字集不同。 
===================== 
一個unicode碼可能轉成長度為一個BYTE,或兩個,三個,四個BYTE的UTF8碼,取決于unicode碼的值。英文unicode碼因為值小于0x80,只要用一個BYTE的UTF8傳送,比送unicode兩個BYTEs快。 
UTF8是為傳送unicode而想出來的“再編碼”方法罷了。 
UTF8轉unicode用我上面給的程序反算即可。

UTF8是現(xiàn)有ASCII系統(tǒng)轉向Unicode系統(tǒng)的一個過渡解決方案。UTF8是保證 ASCII兼容性,再向大字符集方向擴展。這是Unicode推薦的方案。但是因 為解決問題的角度不同,對現(xiàn)有的中文系統(tǒng)不是好的解決方案。 一下連接提供了詳細的 UTF8編碼的初步知識 http://www.acnis.com/modules.php?name=ArticlEfile=articlesid=102 參考資料:http://www.acnis.com/modules.php?name=ArticlEfile=articlesid=102

什么是Unicode。Unicode的基本目標是統(tǒng)一所有的編碼,即它包含所有的字符集。這樣只要一個系統(tǒng)支持Unicode,那么,就能處理這些字符集。一般Unicode有兩個字節(jié)?,F(xiàn)在的windows操作系統(tǒng)都是支持Unicode的。 

什么是UTF8呢?UTF8是一種Unicode編碼,即它的編碼的字符集和Unicode是一致的。但編碼的方式不一樣。對于英文字符來講,UTF8的編碼和一般的一樣,用到一個字節(jié)。但對于中文來講,那么要用三個字節(jié)表示(記憶中是三個)。 

UTF8和Unicode的缺點是在處理查找、搜索等問題時,好像算法上比較復雜,效率不高(記憶中)。
您可能感興趣的文章:
  • UTF-8 Unicode Ansi 漢字GB2321幾種編碼轉換程序
  • Encode/DecodeANSIlt;-gt;UTF8兩個編碼工具 下載
  • 淺析c++ 宏 #val 在unicode下的使用
  • 淺析內存對齊與ANSI C中struct型數據的內存布局
  • java實現(xiàn)十六進制字符unicode與中英文轉換示例
  • Mysql中的排序規(guī)則utf8_unicode_ci、utf8_general_ci的區(qū)別總結
  • Unicode編碼大揭秘
  • VC中實現(xiàn)GB2312、BIG5、Unicode編碼轉換的方法
  • C語言中字符和字符串處理(ANSI字符和Unicode字符)

標簽:喀什 東莞 陽泉 邯鄲 濱州 南充 遼源 海東

巨人網絡通訊聲明:本文標題《utf8和unicode編碼究竟是什么關系?有何區(qū)別?》,本文關鍵詞  utf8,和,unicode,編碼,究竟,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《utf8和unicode編碼究竟是什么關系?有何區(qū)別?》相關的同類信息!
  • 本頁收集關于utf8和unicode編碼究竟是什么關系?有何區(qū)別?的相關信息資訊供網民參考!
  • 推薦文章