主頁 > 知識庫 > 記一次MongoDB性能問題(從MySQL遷移到MongoDB)

記一次MongoDB性能問題(從MySQL遷移到MongoDB)

熱門標簽:老虎洗衣店地圖標注 云南外呼系統(tǒng) 呼和浩特電銷外呼系統(tǒng)加盟 蘋果汽車租賃店地圖標注 怎么投訴地圖標注 杭州人工電銷機器人價格 電銷機器人是什么軟件 廣州長安公司怎樣申請400電話 濟南電銷機器人加盟公司

公司為這個項目專門配備了幾臺高性能務器,清一色的雙路四核超線程CPU,外加32G內(nèi)存,運維人員安裝好MongoDB后,就交我手里了,我習慣于在使用新服務器前先看看相關(guān)日志,了解一下基本情況,當我瀏覽MongoDB日志時,發(fā)現(xiàn)一些警告信息:

WARNING: You are running on a NUMA machine. We suggest launching mongod like this to avoid performance problems: numactl –interleave=all mongod [other options]

當時我并不太清楚NUMA是什么東西,所以沒有處理,只是把問題反饋給了運維人員,后來知道運維人員也沒有理會這茬兒,所以問題的序幕就這樣拉開了。

遷移工作需要導入舊數(shù)據(jù)。MongoDB本身有一個mongoimport工具可供使用,不過它只接受json、csv等格式的源文件,不適合我的需求,所以我沒用,而是用PHP寫了一個腳本,平穩(wěn)運行了一段時間后,我發(fā)現(xiàn)數(shù)據(jù)導入的速度下降了,同時PHP拋出異常:

cursor timed out (timeout: 30000, time left: 0:0, status: 0)

我一時判斷不出問題所在,想想先在PHP腳本里加大Timeout的值應付一下:

?php
MongoCursor::$timeout = -1;
?>

可惜這樣并沒有解決問題,錯誤反倒變著花樣的出現(xiàn)了:

max number of retries exhausted, couldn't send query, couldn't send query: Broken pipe

接著使用strace跟蹤了一下PHP腳本,發(fā)現(xiàn)進程卡在了recvfrom操作上:

shell> strace -f -r -p PID>
recvfrom(FD>,

通過如下命令查詢recvfrom操作的含義:

shell> apropos recvfrom
receive a message from a socket

或者按照下面的方式確認一下:

shell> lsof -p PID>
shell> ls -l /proc/PID>/fd/FD>

此時如果查詢MongoDB的當前操作,會發(fā)現(xiàn)幾乎每個操作會消耗大量的時間:

mongo> db.currentOp()

與此同時,運行mongostat的話,結(jié)果會顯示很高的locked值。

我在網(wǎng)絡上找到一篇:MongoDB Pre-Splitting for Faster Data Loading and Importing,看上去和我的問題很類似,不過他的問題實質(zhì)是由于自動分片導致數(shù)據(jù)遷移所致,解決方法是使用手動分片,而我并沒有使用自動分片,自然不是這個原因。

詢問了幾個朋友,有人反映曾遇到過類似的問題,在他的場景里,問題的主要原因是系統(tǒng)IO操作繁忙時,數(shù)據(jù)文件預分配堵塞了其它操作,從而導致雪崩效應。

為了驗證這種可能,我搜索了一下MongoDB日志:

shell> grep FileAllocator /path/to/log
[FileAllocator] allocating new datafile ... filling with zeroes...
[FileAllocator] done allocating datafile ... took ... secs

我使用的文件系統(tǒng)是ext4(xfs也不錯 ),創(chuàng)建數(shù)據(jù)文件非常快,所以不是這個原因,但如果有人使用ext3,可能會遇到這類問題,所以還是大概介紹一下如何解決:

MongoDB按需自動生成數(shù)據(jù)文件:先是DB>.0,大小是64M,然后是DB>.1,大小翻番到128M,到了DB>.5,大小翻番到2G,其后的數(shù)據(jù)文件就保持在2G大小。為了避免可能出現(xiàn)的問題,可以采用事先手動創(chuàng)建數(shù)據(jù)文件的策略:

#!/bin/sh

DB_NAME=$1

cd /path/to/$DB_NAME

for INDEX_NUMBER in {5..50}; do
  FILE_NAME=$DB_NAME.$INDEX_NUMBER

  if [ ! -e $FILE_NAME ]; then
    head -c 2146435072 /dev/zero > $FILE_NAME
  fi
done

注:數(shù)值2146435072并不是標準的2G,這是INT整數(shù)范圍決定的。

最后一個求助方式就是官方論壇了,那里的國際友人建議我檢查一下是不是索引不佳所致,死馬當活馬醫(yī),我激活了Profiler記錄慢操作:

mongo> use DB>
mongo> db.setProfilingLevel(1);

不過結(jié)果顯示基本都是insert操作(因為我是導入數(shù)據(jù)為主),本身就不需要索引:

mongo> use DB>
mongo> db.system.profile.find().sort({$natural:-1})

問題始終沒有得到解決,求人不如求己,我又重復了幾次遷移舊數(shù)據(jù)的過程,結(jié)果自然還是老樣子,但我發(fā)現(xiàn)每當出問題的時候,總有一個名叫irqbalance的進程CPU占用率居高不下,搜索了一下,發(fā)現(xiàn)很多介紹irqbalance的文章中都提及了NUMA,讓我一下子想起之前在日志中看到的警告信息,我勒個去,竟然繞了這么大一個圈圈!安下心來仔細翻閱文檔,發(fā)現(xiàn)官方其實已經(jīng)有了相關(guān)介紹,按如下設置搞定:

shell> echo 0 > /proc/sys/vm/zone_reclaim_mode
shell> numactl --interleave=all mongod [options]

關(guān)于zone_reclaim_mode內(nèi)核參數(shù)的說明,可以參考官方文檔。

注:從MongoDB1.9.2開始:MongoDB會在啟動時自動設置zone_reclaim_mode。

至于NUMA的含義,簡單點說,在有多個物理CPU的架構(gòu)下,NUMA把內(nèi)存分為本地和遠程,每個物理CPU都有屬于自己的本地內(nèi)存,訪問本地內(nèi)存速度快于訪問遠程內(nèi)存,缺省情況下,每個物理CPU只能訪問屬于自己的本地內(nèi)存。對于MongoDB這種需要大內(nèi)存的服務來說就可能造成內(nèi)存不足,NUMA的詳細介紹,可以參考老外的文章。

理論上,MySQL、Redis、Memcached等等都可能會受到NUMA的影響,需要留意。

您可能感興趣的文章:
  • mongodb數(shù)據(jù)庫遷移變更的解決方案

標簽:自貢 廈門 玉林 雞西 興安盟 遼陽 無錫 泰安

巨人網(wǎng)絡通訊聲明:本文標題《記一次MongoDB性能問題(從MySQL遷移到MongoDB)》,本文關(guān)鍵詞  記,一次,MongoDB,性能,問題,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《記一次MongoDB性能問題(從MySQL遷移到MongoDB)》相關(guān)的同類信息!
  • 本頁收集關(guān)于記一次MongoDB性能問題(從MySQL遷移到MongoDB)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章