一、監(jiān)控架構(gòu)圖
二、實現(xiàn)思路
- 在 Jenkins 上安裝 Metrics 插件,使 Jenkins 暴露 metrics api;
- 編寫python代碼從api抓取數(shù)據(jù),并將數(shù)據(jù)解析為zabbix可以識別的格式;
- 配置 Zabbix server 及 agent 以實現(xiàn)監(jiān)控及告警
三、具體配置
1、安裝Jenkins Metrics插件
插件下載地址:http://updates.jenkins-ci.org/download/plugins/metrics/
安裝 Metrics 插件,在系統(tǒng)配置中,會多出“Metrics”的配置,如下圖:
配置項不復(fù)雜。我們需要點擊“Generate...”生成一個 Access Key(生成后,記得要保存)。這個 Key 用于身份校驗,后面我們會用到。
保存后,我們在瀏覽器中輸入URL:http://jenkins.local,me/metrics/<剛生成的 Access Key> 驗證 Jenkins 是否已經(jīng)暴露 metrics。如果看到如下圖,就說明可以進(jìn)行下一步了:
1.1 Metrics 插件介紹
Metrics 插件是基于 dropwizard/metrics 實現(xiàn)。它通過4個接口暴露指標(biāo)數(shù)據(jù):/metrics,/ping,/threads,/healthcheck。
1.2 Metrics 插件:/metrics 接口介紹
點擊上圖中的metric鏈接(http://jenkins.local.me/metrics/<Access Key>/metrics),它暴露了以下指標(biāo)數(shù)據(jù):
{
version: "4.0.0",
gauges: {...},
counters: {...},
histograms: {...},
meters: {...},
timers: {...}
}
Gauges:某項指標(biāo)的瞬時值,例如:當(dāng)前 Jenkins executor 的總個數(shù)(jenkins.executor.count.value)
Counters:某項指標(biāo)的總數(shù)值,例如:http 請求活動連接數(shù)(http.activeRequests)
Meters:一段時間內(nèi),某事件的發(fā)生概率,例如:Jenkins成功執(zhí)行的任務(wù)每分鐘的執(zhí)行次數(shù)(jenkins.runs.success.m1_rate)
Histogram:統(tǒng)計指標(biāo)的分布情況。例如:Jenkins executor 數(shù)量的分布(jenkins.executor.count.history)
Timer:某項指標(biāo)的持續(xù)時間。例如:Jenkins 任務(wù)等待時間(jenkins.job.waiting.duration)
1.3 Metrics插件其他接口
/ping:接口返回pong代表 Jenkins 存活,如下圖:
/threads:返回 Jenkins 的線程信息
/healthcheck:返回以下指標(biāo):
{
"disk-space" : {
"healthy" : true
},
"plugins" : {
"healthy" : true,
"message" : "No failed plugins"
},
"temporary-space" : {
"healthy" : true
},
"thread-deadlock" : {
"healthy" : true
}
}
Zabbix server 通過與 Zabbix agent 進(jìn)行通信實現(xiàn)數(shù)據(jù)的采集。而 Zabbix agent 又分為被動和主動兩種模式。我們使用的是被動模式,也就是Zabbix server 向 agent 索要數(shù)據(jù)。
所以,我們需要在 Zabbix agent 所在機器放一個獲取 Jenkins 指標(biāo)數(shù)據(jù)的腳本。再配置 Zabbix server 定時從該 agent 獲取數(shù)據(jù),最后配置觸發(fā)器(trigger)實現(xiàn)告警。
2.1 創(chuàng)建監(jiān)控模板并鏈接至主機組
2.2 創(chuàng)建監(jiān)控項
這里需要解釋其中幾個選項為什么要那樣填:
- 類型:是 Zabbix server 采集指標(biāo)的類型,我們選擇的是 Zabbix agent,如上文所說。
- 鍵值:由于我們要監(jiān)控的指標(biāo)并不是 Zabbix 預(yù)定義的。所以,需要使用用戶自定義參數(shù)來實現(xiàn)監(jiān)控 Jenkins 指標(biāo)。Key 填的值為:jenkins.metrics[gauges.jenkins.node.count.value.value]。jenkins.metrics是需要執(zhí)行的真正的 Key 名稱。而 [] 內(nèi)是傳給該 Key 對應(yīng)的命令的參數(shù)。對于初學(xué)者,Zabbix 這部分概念非常不好理解。也許這樣會更好理解:在使用用戶自定義參數(shù)來實現(xiàn)監(jiān)控的情況下,Zabbix server 會將這個 Key 發(fā)送給 agent,然后 agent 根據(jù)這個 Key 執(zhí)行指定的 邏輯 以獲取指標(biāo)數(shù)據(jù)。這個 邏輯 通常是一段腳本(shell命令或Python腳本等)。而腳本也是可以傳參的,[]中的值就是傳給腳本的參數(shù)。
- 信息類型:監(jiān)控數(shù)據(jù)的數(shù)據(jù)類型,由于該監(jiān)控項監(jiān)控的是 Jenkins node 節(jié)點的個數(shù),所以,使用數(shù)字整型。
- 更新間隔:指 Zabbix server 多長時間向 agent 獲取一次數(shù)據(jù)。
到此,Zabbix server 端已經(jīng)配置完成。可以在監(jiān)測->最新數(shù)據(jù)中查看是否有最新的數(shù)據(jù),然后可以創(chuàng)建儀表盤將數(shù)據(jù)以圖形的方式呈現(xiàn)出來。其他監(jiān)控項也可以按此方法進(jìn)行配置。
監(jiān)控腳本代碼
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。