主頁 > 知識庫 > gb2312的詳細(xì)介紹

gb2312的詳細(xì)介紹

熱門標(biāo)簽:嘟聲的電銷機(jī)器人 語音平臺系統(tǒng) 醫(yī)院地圖標(biāo)注 電銷機(jī)器人怎么收費(fèi) 洛陽便宜外呼系統(tǒng)廠家 湖北穩(wěn)定外呼系統(tǒng) 滄州智能外呼系統(tǒng)收費(fèi) 忻州外呼系統(tǒng)接口對接 地圖標(biāo)注和圖片標(biāo)注

基本信息

《信息交換用漢字編碼字符集》是由我國國家標(biāo)準(zhǔn)總局1980年發(fā)布,1981年5月1日開始實(shí)施的一套國家  漢字編碼字符集
標(biāo)準(zhǔn),標(biāo)準(zhǔn)號是GB 2312—1980。它是計算機(jī)可以識別的編碼,適用于漢字處理、漢字通信等系統(tǒng)之間的信息交換?;炯彩杖霛h字6763個和非漢字圖形字符682個。整個字符集分成94個區(qū),每區(qū)有94個位。每個區(qū)位上只有一個字符,因此可用所在的區(qū)和位來對漢字進(jìn)行編碼,稱為區(qū)位碼。
這個碼是唯一的,不會有重碼字。把換算成十六進(jìn)制的區(qū)位碼加上2020H,就得到國標(biāo)碼。國標(biāo)碼加上8080H,就得到常用的計算機(jī)機(jī)內(nèi)碼。1995年又頒布了《漢字編碼擴(kuò)展規(guī)范》(GBK)。GBK與GB 2312—1980國家標(biāo)準(zhǔn)所對應(yīng)的內(nèi)碼標(biāo)準(zhǔn)兼容,同時在字匯一級支持ISO/IEC10646—1和GB 13000—1的全部中、日、韓(CJK)漢字,共計20902字。信息交換用漢字編碼字符集和漢字輸入編碼之間的關(guān)系是,根據(jù)不同的漢字輸入方法,通過必要的設(shè)備向計算機(jī)輸入漢字的編碼,計算機(jī)接收之后,先轉(zhuǎn)換成信息交換用漢字編碼字符,這時計算機(jī)就可以識別并進(jìn)行處理;漢字輸出是先把機(jī)內(nèi)碼轉(zhuǎn)成漢字編碼,再發(fā)送到輸出設(shè)備。

GB標(biāo)準(zhǔn)

2312
GB 2312或GB 2312-80是一個簡體中文字符集的中國國家標(biāo)準(zhǔn),全稱為《信息交換用漢字編碼字符集·基本集》,又稱為GB0,由中國國家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。GB2312編碼通行于中國大陸;新加坡等地也采用此編碼。中國大陸幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB 2312。
GB 2312標(biāo)準(zhǔn)共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個全角字符。
GB 2312的出現(xiàn),基本滿足了漢字的計算機(jī)處理需要,它所收錄的漢字已經(jīng)覆蓋中國大陸99.75%的使用頻率。
對于人名、古漢語等方面出現(xiàn)的罕用字,GB 2312不能處理,這導(dǎo)致了后來GBK及GB 18030漢字字符集的出現(xiàn)。

分區(qū)表示

GB 2312中對所收漢字進(jìn)行了“分區(qū)”處理,每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。
01-09區(qū)為特殊符號。
16-55區(qū)為一級漢字,按拼音排序。
56-87區(qū)為二級漢字,按部首/筆畫排序。
10-15區(qū)及88-94區(qū)則未有編碼。
舉例來說,“啊”字是GB2312之中的第一個漢字,它的區(qū)位碼就是1601。

字節(jié)結(jié)構(gòu)

在使用GB2312的程序中,通常采用EUC儲存方法,以便兼容于ASCII。瀏覽器編碼表上的“GB2312”,通常都是指“EUC-CN”表示法。
每個漢字及符號以兩個字節(jié)來表示。第一個字節(jié)稱為“高位字節(jié)”(也稱“區(qū)字節(jié))”,第二個字節(jié)稱為“低位字節(jié)”(也稱“位字節(jié)”)。
“高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上 0xA0)。 由于一級漢字從16區(qū)起始,漢字區(qū)的“高位字節(jié)”的范圍是0xB0-0xF7,“低位字節(jié)”的范圍是0xA1-0xFE,占用的碼位是 72*94=6768。其中有5個空位是D7FA-D7FE。
例如“啊”字在大多數(shù)程序中,會以兩個字節(jié),0xB0(第一個字節(jié)) 0xA1(第二個字節(jié))儲存。區(qū)位碼=區(qū)字節(jié)+位字節(jié)(與區(qū)位碼對比:0xB0=0xA0+16,0xA1=0xA0+1)。

編碼表

B2312簡體中文編碼表
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0   、 。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ '
A1B0 “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】
A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠
A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵
A1E0 ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
A1F0 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A2A0 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ? ? ? ? ?
A2B0 ? ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖
A2C0 ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾
A2D0 ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦
A2E0 ⑧ ⑨ ⑩ ? ? 一 二 三 四 五 六 七 八 九 十 ?
A2F0 ? Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ ? ?
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0 ! " # ¥ % ' ( ) * + , - . /
A3B0 0 1 2 3 4 5 6 7 8 9 : ; = > ?
A3C0 @ A B C D E F G H I J K L M N O
A3D0 P Q R S T U V W X Y Z [ \ ] ^ _
A3E0 ` a b c d e f g h i j k l m n o
A3F0 p q r s t u v w x y z { | }
……

標(biāo)簽:宜賓 定州 巴彥淖爾 防城港 山南 96 日照 內(nèi)蒙古

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《gb2312的詳細(xì)介紹》,本文關(guān)鍵詞  gb2312,的,詳細(xì),介紹,gb2312,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《gb2312的詳細(xì)介紹》相關(guān)的同類信息!
  • 本頁收集關(guān)于gb2312的詳細(xì)介紹的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章