報警大屏通過大數(shù)據(jù)對告警事件的分析,可以得到一些有價值的IT運行規(guī)律和運行趨勢。例如運維中一些重大事件的發(fā)生與具體業(yè)務系統(tǒng)的關系;重大事件與時間點的關系,不同業(yè)務系統(tǒng)發(fā)生故障之間潛在的關聯(lián)關系,不同事件來源之間的互相影響關系和分析,并以監(jiān)控數(shù)據(jù)動態(tài),形成視化頁面的報警大屏。
從而監(jiān)控大屏,全盤展示IT運行狀態(tài),減輕運維人員的重復性工作量,提高IT系統(tǒng)排錯速度,加速運維知識學習積累。
1.解決運維過程中可固化的、例行且操作步驟復雜的工作項較多,通過人工編寫腳本,執(zhí)行命 令等操作,效率低、風險大、缺乏審核機制。
2.解決部分數(shù)據(jù)分析報告手工統(tǒng)計,時間慢,無法滿足業(yè)務需求。
3.提高可靠性,減輕運維人員繁瑣的手動任務。
4.減少人為錯誤,降低 IT 運維成本,提高運維效率。
5.提高運維效率,需最大限度的節(jié)約人力成本、降低管理風險、提升運維效率和服務滿意 度等維度提升運維效能,縮短聯(lián)系和等待服務臺的時間損耗。
報警大屏分別由6大板塊組成:應用響應時間排行top10、資產(chǎn)運行情況、報警等級分布、資產(chǎn)分類異常統(tǒng)計、資產(chǎn)報警top10、問題詳細頁面,6大板塊。

image.png
應用響應時間排行top10:應用名稱、響應速度形成排行。

image.png
資產(chǎn)運行情況:資產(chǎn)總數(shù)、報警資產(chǎn)數(shù)量、維保到期資產(chǎn)的數(shù)據(jù),計算出運行健康率。

image.png
報警等級分布:未分類、信息、報警、一般嚴重、嚴重、災難形成統(tǒng)計圖表。

image.png
資產(chǎn)分類異常統(tǒng)計:一目了然的獲得資產(chǎn)情況,資產(chǎn)是否正常/異常。

image.png
資產(chǎn)報警top10:一目了然的獲得報警數(shù)據(jù)情況,資產(chǎn)報警數(shù)量形成報警排行。

image.png
詳細問題板塊:由時間、告警IP、持續(xù)時間、問題、嚴重性組成;還可以選擇想要查看的IP進行搜索,根據(jù)報警等級選擇查找。

image.png

image.png
點擊告警源

image.png
查看告警內容;
資產(chǎn)名稱、資產(chǎn)分類、維保日期、所屬網(wǎng)格、網(wǎng)格經(jīng)理、聯(lián)系電話、運行時間、系統(tǒng)、總內存、CPU使用率、內存使用率、磁盤、總空間、已用空間、使用率、已用內存、交換空間、緩存、CPU折線圖、內存折線圖、線程/進程折線圖、網(wǎng)絡寬帶折線圖、每秒上下文切換次數(shù)折線圖、磁盤讀寫速率折線圖、時間、IP地址、主機、問題、嚴重性、持續(xù)時間、一目了然獲得詳細信息。

image.png

image.png
點擊

image.png
查看報警信息:報警詞云、報警態(tài)勢、詳細的時間、IP地址、主機、問題、嚴重性、持續(xù)時間。

image.png
作者:易道云控
鏈接:http://www.itdecent.cn/p/dd5f73c8f3c8
來源:簡書
著作權歸作者所有。商業(yè)轉載請聯(lián)系作者獲得授權,非商業(yè)轉載請注明出處。