服務器性能及業(yè)務監(jiān)控指標,可根據(jù)實際情況調(diào)整,下表供大家參考。
監(jiān)控類別監(jiān)控子對象監(jiān)控維度監(jiān)控指標警告嚴重
服務器CPU負載1分鐘采集,5分鐘告警>=5>=10
利用率1分鐘采集,5分鐘告警>=60%>=80%
溫度1分鐘采集,5分鐘告警>=70℃>=80℃
內(nèi)存利用率1分鐘采集,5分鐘告警>=80%>=90%
磁盤分區(qū)使用率1分鐘采集,5分鐘告警>=80%>=90%
IO/讀寫1分鐘采集,5分鐘告警??
網(wǎng)絡連接監(jiān)聽端口5分鐘告警??
網(wǎng)絡質(zhì)量延遲監(jiān)控服務器到服務器的連通性5分鐘告警>=100ms>=300ms
前端服務器到后端服務器連通性5分鐘告警>=100ms>=300ms
丟包監(jiān)控服務器到服務器的連通性5分鐘告警>=5%>=20%
前端服務器到后端服務器連通性5分鐘告警>=5%>=20%
網(wǎng)卡網(wǎng)絡帶寬in/out5分鐘告警??
網(wǎng)絡數(shù)據(jù)包數(shù)量count/s5分鐘告警??
網(wǎng)絡數(shù)據(jù)包大小bytes/s5分鐘告警??
業(yè)務監(jiān)控端口端口存在性1分鐘采集,及時告警?端口不存在
進程進程存在性1分鐘采集,及時告警?進程不存在
網(wǎng)絡流量所有業(yè)務流量總合1分鐘采集,5分鐘告警??
注冊注冊響應時間2小時采集,5分鐘告警>=20s>=30s
登錄登錄響應時間10分鐘采集,5分鐘告警>=20s>=30s
充值充值響應時間10分鐘采集,5分鐘告警>=20s>=30s
自定義監(jiān)控Nginx,Redis等
內(nèi)容監(jiān)控HTTP狀態(tài)監(jiān)控監(jiān)控關鍵頁面響應時間5分鐘采集,及時告警>=5s>=10s
監(jiān)控關鍵頁面關鍵字,如數(shù)據(jù)庫連接成功/失敗1分鐘采集,及時告警?內(nèi)容不匹配
數(shù)據(jù)庫監(jiān)控數(shù)據(jù)庫連通性監(jiān)控數(shù)據(jù)庫是否存活1分鐘采集,及時告警??
數(shù)據(jù)庫連接數(shù)5分鐘告警??
主從監(jiān)控主從同步狀態(tài)1分鐘采集,及時告警??
內(nèi)存使用內(nèi)存使用率10分鐘采集,5分鐘告警??
索引索引使用率10分鐘采集,5分鐘告警??
緩存緩存使用率10分鐘采集,5分鐘告警??
表鎖表鎖狀態(tài)10分鐘采集,5分鐘告警??
DMLselect,insert,update,delete10分鐘采集,5分鐘告警??
TPSTPS/S10分鐘采集,5分鐘告警??
流量in/out 流量5分鐘告警??
