目錄
- VARCHAR 和 CHAR 類型
- 結(jié)語:
VARCHAR 和 CHAR 類型
VARCHAR 和 CHAR 是兩種主要的字符串類型,用于存儲字符。不幸的是,由于實現(xiàn)的方式依賴于存儲引擎,因此很難解釋這些字符串在磁盤和內(nèi)存中如何存儲,除了除了常用的 InnoDB 和 MyISAM 外,假設(shè)你使用了其他存儲引擎,應(yīng)當(dāng)仔細閱讀存儲引擎的文檔。
VARCHAR 存儲可變長度的字符串,也是最常用的字符數(shù)據(jù)類型。相比固定長度的類型,VARCHAR 所需的存儲空間更小,它會盡可能少地使用存儲空間(例如,短的字符串占據(jù)的空間)。對于 MyISAM 來說,如果創(chuàng)建表的時候指定了 ROW_FORMAT=FIXED 的話,那么會使用固定的空間存儲字段而導(dǎo)致空間浪費。VARCHAR 使用1-2個額外的字節(jié)存儲字符串的長度:當(dāng)最大長度低于255字節(jié)的時候使用1個字節(jié),如果更多的話就使用2個字節(jié)。因此,拉丁字符集的 VARCHAR(10)會使用11個字節(jié)的存儲空間,而 VARCHAR(1000)則會使用1002個字節(jié)的存儲空間。
VARCHAR 由于能夠節(jié)省空間,因此可以改善性能。但是,由于長度可變,當(dāng)更新數(shù)據(jù)表的時候數(shù)據(jù)行的存儲空間會變化,這一定程度上會帶來額外的開銷。如果數(shù)據(jù)行的長度導(dǎo)致原有的存儲位置無法存放,那么不同的存儲引擎會做不同的處理。例如 MyISAM 可能產(chǎn)生數(shù)據(jù)行的碎片,而 InnoDB 需要進行磁盤分頁來存放更新后的數(shù)據(jù)行。
通常,如果最大的列長度遠遠高于平均長度的話(例如可選的備注字段),使用 VARCHAR 是劃算的,同時如果更新的頻次很低,那么碎片化也不會是一個問題。需要注意的是,如果使用的是 UTF-8字符集,則實際存儲的字節(jié)長度是根據(jù)字符定的。對于中文,推薦的存儲字符集是 utf8mb4。
CHAR 類型的長度是固定的,MySQL 會對每個字段分配足夠的存儲空間。存儲CHAR 類型值的時候,MySQL 會移除后面多出來的空字符。值是使用空字符進行對齊以便進行比較。對于短的字符串來說,使用 CHAR 更有優(yōu)勢,而如果所有的值的長度幾乎一致的話,就可以使用 CHAR。例如存儲用戶密碼的MD5值時使用 CHAR 就更合適,這是因為 MD5的長度總是固定的。同時,對于字段值經(jīng)常改變的數(shù)據(jù)類型來說,CHAR 相比 VARCHAR 也更有優(yōu)勢,因為 CHAR 不會產(chǎn)生碎片。對于很短的數(shù)據(jù)列,使用 CHAR 比 VARCHAR更高效,例如使用CHAR(1)存儲邏輯值的 Y 和 N,這種情況下只需要1個字節(jié),而 VARCHAR 需要2個字節(jié)。 對于移除空字符這個特性會感覺奇怪,我們舉個例子:
CREATE TABLE t_char_varchar_test (
id INT PRIMARY KEY,
char_col CHAR(10),
varchar_col VARCHAR(10)
);
INSERT INTO t_char_varchar_test
VALUES
(1, 'string1', 'string1'),
(2, ' string2', ' string2'),
(3, 'string3 ', 'string3 ');
按上面的結(jié)果插入數(shù)據(jù)表后,string2中的前置空格不會移除,但使用 CHAR 類型存儲時,string3尾隨空格會被移除,使用 SQL 查詢結(jié)果來檢驗一下:
SELECT CONCAT("'", char_col, "'"), CONCAT("'", varchar_col, "'")
FROM t_char_varchar_test WHERE 1
得出來的結(jié)果如下,可以看到 CHAR 類型的 string3后面的空格被移除了,而 VARCHAR類型的沒有。這種情況大多數(shù)時候不會有什么問題,實際在應(yīng)用中也經(jīng)常會使用 trim 函數(shù)移除兩端的空字符,但是如果確實需要存儲空格的時候,那就需要注意不要選擇使用 CHAR 類型:
數(shù)據(jù)如何存儲是由存儲引擎決定的,而且存儲引擎處理固定長度和可變長度的數(shù)據(jù)的方式并不相同。Memory 引擎使用固定大小的行,因此它需要分配最大可能的存儲空間——即便數(shù)據(jù)長度是可變的。但是,對于字符串的對齊和空字符截斷是由 MySQL 服務(wù)端完成的,因此所有存儲引擎都是一樣的。
與 CHAR 和 VARCHAR 相似的是 BINARY和 VARBINARY,用于存儲二進制字節(jié)字符,BINARY 的對齊使用字符0的字節(jié)值來對齊,并且再獲取值的時候不會截斷。如果需要使用字符的字節(jié)值而不是字符的話,使用 BINARY 會更高效,這是因為比較時,一方面不需要考慮大小寫,另一方面是MySQL一次只比較一個字節(jié)。
結(jié)語:
在實際數(shù)據(jù)表設(shè)計中,大多數(shù)情況下會選擇使用 VARCHAR,但 VARCHAR 需要額外的1-2個字節(jié)存儲字符串長度。需要注意的是在應(yīng)用中最好能夠限定字段的最大長度,從而可以使得數(shù)據(jù)表盡可能使用短的 VARCHAR來提高效率。同時,對于固定長度、長度很短或長度變化很小的字符類型,推薦使用 CHAR 類存儲,以提高存儲效率。
以上就是MySQL CHAR和VARCHAR的選擇的詳細內(nèi)容,更多關(guān)于MySQL CHAR和VARCHAR的資料請關(guān)注腳本之家其它相關(guān)文章!
您可能感興趣的文章:- Mysql中varchar類型一些需要注意的地方
- MySQL CHAR和VARCHAR存儲、讀取時的差別
- MYSQL中 char 和 varchar的區(qū)別
- MySQL中字段類型char、varchar和text的區(qū)別
- mysql varchar類型求和實例操作
- 對比MySQL中int、char以及varchar的性能
- MySQL動態(tài)修改varchar長度的方法
- Mysql中varchar長度設(shè)置方法
- Mysql數(shù)據(jù)庫中把varchar類型轉(zhuǎn)化為int類型的方法
- mysql如何處理varchar與nvarchar類型中的特殊字符
- 當(dāng)面試官問mysql中char與varchar的區(qū)別