MongoDB 是高性能數(shù)據(jù),但是在使用的過程中,大家偶爾還會(huì)碰到一些性能問題。MongoDB和其它關(guān)系型數(shù)據(jù)庫相比,例如 SQL Server 、MySQL 、Oracle 相比來說,相對較新,很多人對其不是很熟悉,所以很多開發(fā)、DBA往往是注重功能的實(shí)現(xiàn),而忽視了性能的要求。其實(shí),MongoDB和 SQL Server 、MySQL 、Oracle 一樣,一個(gè) 數(shù)據(jù)庫對象的設(shè)計(jì)調(diào)整、索引的創(chuàng)建、語句的優(yōu)化,都會(huì)對性能產(chǎn)生巨大的影響。
為了充分挖掘MongoDB性能,現(xiàn)簡單總計(jì)了以下18條,歡迎大家一起來持續(xù)總結(jié)完善。
(1)文檔中的_id鍵推薦使用默認(rèn)值,禁止向_id中保存自定義的值。
解讀: MongoDB文檔中都會(huì)有一個(gè)“_id”鍵,默認(rèn)是個(gè)ObjectID對象(標(biāo)識符中包含時(shí)間戳、機(jī)器ID、進(jìn)程ID和計(jì)數(shù)器)。MongoDB在指定_id與不指定_id插入時(shí) 速度相差很大,指定_id會(huì)減慢插入的速率。
(2)推薦使用短字段名。
解讀:與關(guān)系型數(shù)據(jù)庫不同,MongoDB集合中的每一個(gè)文檔都需要存儲(chǔ)字段名,長字段名會(huì)需要更多的存儲(chǔ)空間。
(3)MongoDB索引可以提高文檔的查詢、更新、刪除、排序操作,所以結(jié)合業(yè)務(wù)需求,適當(dāng)創(chuàng)建索引。
(4)每個(gè)索引都會(huì)占用一些空間,并且導(dǎo)致插入操作的資源消耗,因此,建議每個(gè)集合的索引數(shù)盡量控制在5個(gè)以內(nèi)。
(5)對于包含多個(gè)鍵的查詢,創(chuàng)建包含這些鍵的復(fù)合索引是個(gè)不錯(cuò)的解決方案。復(fù)合索引的鍵值順序很重要,理解索引最左前綴原則。
解讀:例如在test集合上創(chuàng)建組合索引{a:1,b:1,c:1}。執(zhí)行以下7個(gè)查詢語句:
db.test.find({a:”hello”}) // 1
db.test.find({b:”sogo”, a:”hello”}) // 2
db.test.find({a:”hello”,b:”sogo”, c:”666”}) // 3
db.test.find({c:”666”, a:”hello”}) // 4
db.test.find({b:”sogo”, c:”666”}) // 5
db.test.find({b:”sogo” }) // 6
db.test.find({c:”666”}) // 7
以上查詢語句可能走索引的是1、2、3、4
查詢應(yīng)包含最左索引字段,以索引創(chuàng)建順序?yàn)闇?zhǔn),與查詢字段順序無關(guān)。
最少索引覆蓋最多查詢。
(6)TTL 索引(time-to-live index,具有生命周期的索引),使用TTL索引可以將超時(shí)時(shí)間的文檔老化,一個(gè)文檔到達(dá)老化的程度之后就會(huì)被刪除。
解讀:創(chuàng)建TTL的索引必須是日期類型。TTL索引是一種單字段索引,不能是復(fù)合索引。TTL刪除文檔后臺線程每60s移除失效文檔。不支持定長集合。
(7)需要在集合中某字段創(chuàng)建索引,但集合中大量的文檔不包含此鍵值時(shí),建議創(chuàng)建稀疏索引。
解讀:索引默認(rèn)是密集型的,這意味著,即使文檔的索引字段缺失,在索引中也存在著一個(gè)對應(yīng)關(guān)系。在稀疏索引中,只有包含了索引鍵值的文檔才會(huì)出現(xiàn)。
(8)創(chuàng)建文本索引時(shí)字段指定text,而不是1或者-1。每個(gè)集合只有一個(gè)文本索引,但是它可以為任意多個(gè)字段建立索引。
解讀:文本搜索速度快很多,推薦使用文本索引替代對集合文檔的多字段的低效查詢。
(9)使用findOne在數(shù)據(jù)庫中查詢匹配多個(gè)項(xiàng)目,它就會(huì)在自然排序文件集合中返回第一個(gè)項(xiàng)目。如果需要返回多個(gè)文檔,則使用find方法。
(10)如果查詢無需返回整個(gè)文檔或只是用來判斷鍵值是否存在,可以通過投影(映射)來限制返回字段,減少網(wǎng)絡(luò)流量和客戶端的內(nèi)存使用。
解讀:既可以通過設(shè)置{key:1}來顯式指定返回的字段,也可以設(shè)置{key:0}指定需要排除的字段。
(11)除了前綴樣式查詢,正則表達(dá)式查詢不能使用索引,執(zhí)行的時(shí)間比大多數(shù)選擇器更長,應(yīng)節(jié)制性地使用它們。
(12)在聚合運(yùn)算中,$要在match要在$group前面,通過$前置,可以減少match前置,可以減少$ group 操作符要處理的文檔數(shù)量。
(13)通過操作符對文檔進(jìn)行修改,通??梢垣@得更好的性能,因?yàn)?,不需要往返服?wù)器來獲取并修改文檔數(shù)據(jù),可以在序列化和傳輸數(shù)據(jù)上花費(fèi)更少的時(shí)間。
(14)批量插入(batchInsert)可以減少數(shù)據(jù)向服務(wù)器的提交次數(shù),提高性能。但是批量提交的BSON Size不超過48MB。
(15)禁止一次取出太多的數(shù)據(jù)進(jìn)行排序,MongoDB目前支持對32M以內(nèi)的結(jié)果集進(jìn)行排序。如果需要排序,請盡量限制結(jié)果集中的數(shù)據(jù)量。
(16)查詢中的某些$操作符可能會(huì)導(dǎo)致性能低下,如操作符可能會(huì)導(dǎo)致性能低下,如$ne,$,not,$exists,$nin,$or盡量在業(yè)務(wù)中不要使用。
a) $exist:因?yàn)樗缮⒌奈臋n結(jié)構(gòu)導(dǎo)致查詢必須遍歷每一個(gè)文檔;
b) $ne:如果當(dāng)取反的值為大多數(shù),則會(huì)掃描整個(gè)索引;
c) $not:可能會(huì)導(dǎo)致查詢優(yōu)化器不知道應(yīng)當(dāng)使用哪個(gè)索引,所以會(huì)經(jīng)常退化為全表掃描;
d) $nin:全表掃描;
e) \$有多個(gè)條件就會(huì)查詢多少次,最后合并結(jié)果集,應(yīng)該考慮裝換為or:有多個(gè)條件就會(huì)查詢多少次,最后合并結(jié)果集,應(yīng)該考慮裝換為$in。
(17)固定集合可以用于記錄日志,其插入數(shù)據(jù)更快,可以實(shí)現(xiàn)在插入數(shù)據(jù)時(shí),淘汰最早的數(shù)據(jù)。需求分析和設(shè)計(jì)時(shí),可考慮此特性,即提高了性能,有省去了刪除動(dòng)作。
解讀:固定集合需要顯式創(chuàng)建,指定Size的大小,還能夠指定文檔的數(shù)量。集合不管先達(dá)到哪一個(gè)限制,之后插入的新文檔都會(huì)把最老的文檔移出。
(18)集合中文檔的數(shù)據(jù)量會(huì)影響查詢性能,為保持適量,需要定期歸檔。
Mongodb性能優(yōu)化
數(shù)據(jù)庫性能對軟件整體性能有著至關(guān)重要的影響,對于Mongodb數(shù)據(jù)庫常用的性能優(yōu)化方法主要有:
1、范式化與反范式化;
2、填充因子的使用;
3、索引的使用;
以上就是本次給大家整理的關(guān)于提升MongoDB性能的方法的全部內(nèi)容,感謝大家對腳本之家的支持。
您可能感興趣的文章:- 記一次MongoDB性能問題(從MySQL遷移到MongoDB)
- MongoDB數(shù)據(jù)庫查詢性能提高40倍的經(jīng)歷分享
- 淺析Mongodb性能優(yōu)化的相關(guān)問題
- MongoDB性能篇之創(chuàng)建索引,組合索引,唯一索引,刪除索引和explain執(zhí)行計(jì)劃
- MongoDB查詢性能優(yōu)化驗(yàn)證及驗(yàn)證
- MongoDB性能優(yōu)化及監(jiān)控