服務(wù)器運維難度高的原因,很大程度是因為服務(wù)器一旦出現(xiàn)問題,生產(chǎn)環(huán)境的業(yè)務(wù)就會受到嚴(yán)重影響,極有可能帶來難以承擔(dān)的后果。因此這份工作要求工程師保持高要求的服務(wù)質(zhì)量,能夠快速響應(yīng)問題,及時解決問題。
但是“及時”的這一點很難做到,需要通過優(yōu)化工作流程、建立預(yù)警系統(tǒng),搭建自動化等行為快速響應(yīng)。今天主要介紹如何通過服務(wù)器運維工具搭建監(jiān)控預(yù)警的手段來輔助縮短響應(yīng)時間。
??首先打開牧云主機管理助手,進(jìn)入系統(tǒng)設(shè)置界面,點擊“監(jiān)控告警”按鈕,監(jiān)控項中內(nèi)置了「主機上線」、「主機離線」、「安全掃描」等監(jiān)控規(guī)則。


如果需要自定義監(jiān)控規(guī)則,可以點擊右上↗?“添加監(jiān)控項”按鈕??梢宰远x服務(wù)器cpu及內(nèi)存的告警占用值,如果還有其他的監(jiān)控項需要設(shè)定,可以自定義監(jiān)控腳本,并設(shè)定告警的觸發(fā)方式。


??完成監(jiān)控項設(shè)置后,進(jìn)入百川平臺的消息通知頁面,只要定義告警空間、產(chǎn)品應(yīng)用及規(guī)則名稱后,就可以通過郵箱/釘釘/企業(yè)微信/飛書等平臺發(fā)布告警信息。


完成設(shè)置后,監(jiān)控下的服務(wù)器只要出現(xiàn)異常情況,就可以通過指定的接收渠道發(fā)送告警信息,即使不在公司也可以實時響應(yīng)服務(wù)器的各種問題,打開瀏覽器通過web terminal就可以進(jìn)行運維操作啦??!
