欧美伊人久久大香线蕉综合69,色综合久久久久综合体桃花网

主頁 > 知識(shí)庫 > SQLserver排序規(guī)則基本概念探索

SQLserver排序規(guī)則基本概念探索

前言

昨天在論壇里面遇到一個(gè)比較特殊的場景。他的公司做的是海外的項(xiàng)目，中英再加一個(gè)當(dāng)?shù)卣Z言，要兼容三種文字啊.
那有沒有什么字符集或排序規(guī)則，能兼容所有文字的？對于海外項(xiàng)目很痛苦啊 .Oracle 有AL32UTF8 ，MySQL 有UTF8 ，那SQL Server 有嗎？

基本概念

ASCII編碼

在計(jì)算機(jī)發(fā)明后不久，計(jì)算機(jī)只在美國用。他們創(chuàng)造出了ASCII編碼，來表示：空格、標(biāo)點(diǎn)符號(hào)、數(shù)字、大小寫字母，控制符等?？梢酝暾谋磉_(dá)所有的英文。但是也只支持英文。

GBK編碼

后來隨著計(jì)算機(jī)的流行，中國人民通過對 ASCII 編碼的中文擴(kuò)充改造，產(chǎn)生了 GB2312 編碼，可以表示6000多個(gè)常用漢字。漢字實(shí)在是太多了，包括繁體和各種字符，于是產(chǎn)生了

GBK 編碼，它包括了 GB2312 中的編碼，同時(shí)擴(kuò)充了很多。中國是個(gè)多民族國家，各個(gè)民族幾乎都有自己獨(dú)立的語言系統(tǒng)，為了表示那些字符，繼續(xù)把 GBK 編碼擴(kuò)充為 GB18030 編碼。

每個(gè)國家都像中國一樣，把自己的語言編碼，于是出現(xiàn)了各種各樣的編碼，如果你不安裝相應(yīng)的編碼，就無法解釋相應(yīng)編碼想表達(dá)的內(nèi)容。

終于，有個(gè)叫 ISO 的組織看不下去了。他們一起創(chuàng)造了一種編碼 UNICODE ，這種編碼非常大，大到可以容納世界上任何一個(gè)文字和標(biāo)志。所以只要電腦上有 UNICODE 這種編碼系統(tǒng)，無論是全球哪種文字，只需要保存文件的時(shí)候，保存成 UNICODE 編碼就可以被其他電腦正常解釋。

UTF-8 AND UTF-16

UNICODE 在網(wǎng)絡(luò)傳輸中，出現(xiàn)了兩個(gè)標(biāo)準(zhǔn) UTF-8 和 UTF-16，分別每次傳輸 8個(gè)位（2個(gè)字節(jié)）和 16個(gè)位（4個(gè)字節(jié)）。于是就會(huì)有人產(chǎn)生疑問，UTF-8 既然能保存那么多文字、符號(hào)，為什么國內(nèi)還有這么多使用 GBK 等編碼的人？因?yàn)?UTF-8 等編碼體積比較大，占電腦空間比較多，如果面向的使用人群絕大部分都是中國人，用GBK 等編碼也可以。

總的來說：

Unicode 是「字符集」

UTF-8 是「編碼規(guī)則」

其中：

字符集：為每一個(gè)「字符」分配一個(gè)唯一的 ID（學(xué)名為碼位 / 碼點(diǎn) / Code Point）
編碼規(guī)則：將「碼位」轉(zhuǎn)換為字節(jié)序列的規(guī)則（編碼/解碼可以理解為加密/解密的過程）

排序規(guī)則

比如我們常用的：Chinese_PRC_CI_AS ，前面部分是Chinese_PRC 這個(gè)部分表示支持的中國大陸的字符集。但是這里有個(gè)特別需要注意的事項(xiàng)，劃重點(diǎn)，在很多博客上面會(huì)有這樣的描述：

大陸簡體字UNICODE的排序規(guī)則

這里有很大的歧義。并不是說這個(gè)排序規(guī)則對所有字符都是有的Unicode。這樣說并不準(zhǔn)確。

排序規(guī)則的后半部份即后綴含義：

　　_BIN 二進(jìn)制排序
　　_CI(CS) 是否區(qū)分大小寫，CI不區(qū)分，CS區(qū)分(case-insensitive/case-sensitive)
　　_AI(AS) 是否區(qū)分重音，AI不區(qū)分，AS區(qū)分(accent-insensitive/accent-sensitive)
　　_KI(KS) 是否區(qū)分假名類型,KI不區(qū)分，KS區(qū)分(kanatype-insensitive/kanatype-sensitive)
　　_WI(WS) 是否區(qū)分寬度 WI不區(qū)分，WS區(qū)分(width-insensitive/width-sensitive)　

區(qū)分大小寫:如果想讓比較將大寫字母和小寫字母視為不等，請選擇該選項(xiàng)。

區(qū)分重音:如果想讓比較將重音和非重音字母視為不等，請選擇該選項(xiàng)。如果選擇該選項(xiàng)，

比較還將重音不同的字母視為不等。

區(qū)分假名:如果想讓比較將片假名和平假名日語音節(jié)視為不等，請選擇該選項(xiàng)。

區(qū)分寬度:如果想讓比較將半角字符和全角字符視為不等，請選擇該選項(xiàng)

Unicode

SQL SERVER 是支持Unicode的。對應(yīng)的字符類型是nchar,nvarchar.

總結(jié)

所以，SQL SERVER 沒有這樣的和ORACLE UTF-8類似的排序規(guī)則。。如果是三種文字，建議把所有的字符類型定義為nchar,nvarchar 。

以上就是本文關(guān)于SQLserver排序規(guī)則基本概念探索的全部內(nèi)容，希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站：淺談sqlserver下float的不確定性、SQLserver中cube：多維數(shù)據(jù)集實(shí)例詳解、sqlserver:查詢鎖住sql以及解鎖方法等，有什么問題可以隨時(shí)留言，小編會(huì)及時(shí)回復(fù)大家，在此也希望朋友們對本站多多支持！

您可能感興趣的文章:

整理一下SQLSERVER的排序規(guī)則

標(biāo)簽：防疫戰(zhàn)設(shè) 來賓七臺(tái)河威海銅仁益陽宿州天水

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《SQLserver排序規(guī)則基本概念探索》，本文關(guān)鍵詞 SQLserver,排序,規(guī)則,基本概念,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。