你可在監(jiān)控服務(wù)中為賬戶所有的容器、服務(wù)和 RDS 實(shí)例創(chuàng)建并配置狀態(tài)維度報(bào)警和事件報(bào)警,推送到指定手機(jī)和郵箱。監(jiān)控首頁展示已配置的報(bào)警列表,包含報(bào)警名稱、報(bào)警針對(duì)的服務(wù)模塊、報(bào)警對(duì)象、報(bào)警規(guī)則等信息。通過列表右上角的「選擇模塊」,可以篩選展示針對(duì)不同模塊的報(bào)警。點(diǎn)擊右側(cè)操作欄中的「設(shè)置」,可以修改相應(yīng)的報(bào)警配置。
創(chuàng)建報(bào)警
點(diǎn)擊監(jiān)控首頁左上角的「創(chuàng)建報(bào)警」,進(jìn)入創(chuàng)建報(bào)警頁面。按提示填寫報(bào)警名稱,選擇報(bào)警類型。
報(bào)警規(guī)則、對(duì)象和通知配置詳情說明如下:
報(bào)警規(guī)則
1.狀態(tài)維度報(bào)警
當(dāng)選擇報(bào)警類型為狀態(tài)維度報(bào)警時(shí),可以在這里配置報(bào)警項(xiàng)和閾值,支持同時(shí)添加多條規(guī)則,滿足其中任意一條時(shí)即觸發(fā)報(bào)警。蜂巢默認(rèn)提供了兩條常用規(guī)則,你也可刪除或修改后自行配置。注意:報(bào)警閾值聚合區(qū)間為 1 分鐘,連續(xù) 5 個(gè)聚合區(qū)間達(dá)到閾值,觸發(fā)報(bào)警。
2.事件報(bào)警
當(dāng)選擇報(bào)警類型為事件報(bào)警時(shí),可以在這里配置報(bào)警事件,支持同時(shí)添加多條事件,滿足其中任意一條時(shí)即觸發(fā)報(bào)警,如下圖所示:
報(bào)警對(duì)象
選擇了報(bào)警模塊后,你在該模塊中已創(chuàng)建的對(duì)象都會(huì)顯示在報(bào)警對(duì)象一欄。倘若進(jìn)行勾選,表示上述定義的報(bào)警規(guī)則適用該對(duì)象,默認(rèn)全選。全選框被選定時(shí),以后在該模塊中新創(chuàng)建的對(duì)象也會(huì)自動(dòng)適配該報(bào)警。
報(bào)警通知
填寫手機(jī)和郵箱用于接收?qǐng)?bào)警信息,如下圖所示:
修改報(bào)警
在監(jiān)控首頁,點(diǎn)擊「設(shè)置」進(jìn)入設(shè)置報(bào)警頁面。你可以對(duì)報(bào)警規(guī)則、報(bào)警對(duì)象和接收?qǐng)?bào)警信息的手機(jī)、郵箱進(jìn)行修改,各項(xiàng)配置詳細(xì)說明請(qǐng)參看 創(chuàng)建報(bào)警。你還可以在該頁面還可以刪除報(bào)警。
性能監(jiān)控
發(fā)現(xiàn)問題
性能監(jiān)控通過探針的方式,分布式地采集集群運(yùn)行數(shù)據(jù),匯總到監(jiān)控服務(wù)器。監(jiān)控服務(wù)器記錄、整理、分析性能數(shù)據(jù),最后產(chǎn)生監(jiān)控圖表,展示給用戶查看。
現(xiàn)有的監(jiān)控圖表有: 集群管理列表儀表盤 和 集群性能儀盤表。
集群列表儀盤表
通過集群列表儀表盤,你可以看到一個(gè)集群 30 分鐘內(nèi)的性能數(shù)據(jù)指標(biāo),如下圖所示,這些指標(biāo)包括:
健康異常記錄:超出規(guī)定指標(biāo)的數(shù)據(jù)將被記錄到健康異常中。
平均響應(yīng)時(shí)間:入口請(qǐng)求在觀察周期內(nèi)的平均響應(yīng)時(shí)間。
請(qǐng)求頻率、請(qǐng)求次數(shù):入口請(qǐng)求在觀察周期內(nèi)的請(qǐng)求次數(shù)和頻率(按分鐘計(jì))。
錯(cuò)誤頻率、錯(cuò)誤次數(shù)、錯(cuò)誤率:入口請(qǐng)求在觀察周期內(nèi)的錯(cuò)誤次數(shù)和頻率(按分鐘計(jì)),以及錯(cuò)誤次數(shù)與請(qǐng)求次數(shù)的比例。
集群性能儀盤表
點(diǎn)擊具體的集群實(shí)例,進(jìn)入集群詳情后,可以在集群性能儀表盤中看到下圖,其中包括了:
1.拓?fù)鋱D:觀察周期內(nèi),當(dāng)前集群實(shí)例與其他集群實(shí)例或者第三方服務(wù)的拓?fù)潢P(guān)系,以及他們彼此間的請(qǐng)求頻率和平均響應(yīng)時(shí)間。
2.健康狀態(tài)異??傆[:觀察周期內(nèi)健康事件的記錄數(shù)。
3.慢響應(yīng)總覽折線圖:觀察周期內(nèi),慢響應(yīng)、極慢響應(yīng)、無響應(yīng)的請(qǐng)求數(shù)量變化趨勢(shì)。
4.平均響應(yīng)時(shí)間折線圖:觀察周期內(nèi),平均響應(yīng)時(shí)間變化趨勢(shì)。
5.請(qǐng)求頻率折線圖:觀察周期內(nèi),請(qǐng)求頻率的變化趨勢(shì)。
6.錯(cuò)誤率折線圖:觀察周期內(nèi),錯(cuò)誤比例的變化趨勢(shì)。
性能監(jiān)控可以采集到集群的多項(xiàng)數(shù)據(jù)指標(biāo),你可以根據(jù)這些指標(biāo)定義健康判定規(guī)則(自定義功能暫未開放),同時(shí)蜂巢也根據(jù)多年的經(jīng)驗(yàn),設(shè)定了一些默認(rèn)的健康判定規(guī)則。當(dāng)集群監(jiān)控通過健康規(guī)則判斷,發(fā)現(xiàn)集群出現(xiàn)異常時(shí),會(huì)產(chǎn)生健康異常通知,并在健康明細(xì)中進(jìn)行記錄。
通過上面的圖表,你可以快速判斷系統(tǒng)是否出問題,以及問題的大致類型是什么。蜂巢還提供了豐富的明細(xì)圖表和快照信息,幫助用你速定位問題,如下圖所示:
通過明細(xì)圖表,你可以看到:
每個(gè)訪問的請(qǐng)求,具體的統(tǒng)計(jì)信息。
慢的請(qǐng)求、出錯(cuò)的請(qǐng)求、以及健康異常事件的記錄。
如果需要進(jìn)一步確定問題的原因,還可以使用快照功能。異常記錄前面若有照相機(jī)圖標(biāo),表示蜂巢記錄了這次異常記錄的快照信息,如下圖所示:
點(diǎn)擊照相機(jī)圖標(biāo),你可以看到這次請(qǐng)求處理中具體的調(diào)用鏈路、響應(yīng)時(shí)長、以及報(bào)出的異常信息等快照信息。
監(jiān)控自動(dòng)化
根據(jù)性能監(jiān)控采集的數(shù)據(jù),你可以設(shè)置報(bào)警通知(目前未全部開放)。根據(jù)各類性能監(jiān)測(cè)的事件、觸發(fā)告警通知,你可以及時(shí)地通知到負(fù)責(zé)人處理運(yùn)維問題。
日志服務(wù)
1.收集范圍
目前日志服務(wù)會(huì)收集集群管理、容器管理等兩類服務(wù)里用戶所產(chǎn)生的日志信息:
(1)集群管理 里日志服務(wù)會(huì)收集標(biāo)準(zhǔn) Docker 輸出信息和用戶自定義日志目錄下的日志文件信息。
(2)容器管理 里日志服務(wù)會(huì)收集用戶容器產(chǎn)生的標(biāo)準(zhǔn) Docker 輸出信息;
2.整體介紹
進(jìn)入到控制臺(tái)左側(cè)菜單中的日志服務(wù)頁面后,日志服務(wù)的功能從上到下依次為:
(1)幫助文檔
(2)日志分類、選擇過濾框
(3)日志主體顯示區(qū)域
(4)實(shí)時(shí)狀態(tài)顯示按鈕
(5)搜索框
(6)主題更換按鈕
(7)全屏按鈕
如下圖所示:
其中,
(1)日志分類、選擇過濾框可以按容器名、服務(wù)名以及日志文件名進(jìn)行日志過濾;
(2)日志主體顯示區(qū)域中,每行日志分別顯示日志時(shí)間、容器/服務(wù)名、日志文件、日志內(nèi)容;
(3)實(shí)時(shí)狀態(tài)按鈕可以控制實(shí)時(shí)展示或暫停;
(4)主題更換按鈕可以進(jìn)行日志展示風(fēng)格的變換;
(5)全屏按鈕可以控制閱讀日志時(shí)的全屏及縮回。
2.集群、容器管理
創(chuàng)建集群或容器后,日志服務(wù)自動(dòng)會(huì)開始對(duì)集群或容器產(chǎn)生的標(biāo)準(zhǔn)輸出進(jìn)行收集。此時(shí),你可以直接到日志服務(wù)頁面里進(jìn)行查看,無需任何操作。
你可以選擇需要查看的集群或者容器的相應(yīng)日志,如下圖所示(注意:剛創(chuàng)建的容器需要稍稍等待一段時(shí)間):
選擇某個(gè)集群或容器后,你可以再選擇文件進(jìn)行進(jìn)一步的篩選。不過在容器中,文件通常僅有「DOCKER-STDOUT」。
3.標(biāo)準(zhǔn)輸出
集群管理的標(biāo)準(zhǔn)輸出日志同容器管理一致,可參考上述。
4.自定義日志目錄
集群管理中比容器管理擁有一項(xiàng)更自由強(qiáng)大的功能,你可以自定義一個(gè)或多個(gè)日志輸出目錄。服務(wù)創(chuàng)建后,你只需往自定義目錄里寫入日志,就可以被日志服務(wù)收集到并進(jìn)行后續(xù)的展示及處理。
自定義日志目錄需在創(chuàng)建集群時(shí)指定,如下圖所示:
展示后的效果和標(biāo)準(zhǔn)輸出基本類似,但在文件過濾框中會(huì)多出自定義日志文件名。
5.搜索功能
日志服務(wù)可以在底層搜索框進(jìn)行自由化的搜索,進(jìn)行搜索后日志仍會(huì)實(shí)時(shí)的輸出(只輸出包含搜索條件的日志),方便你快速的定位日志中的內(nèi)容,搜索命中的結(jié)果還會(huì)進(jìn)行高亮的顯示。