開源免費(fèi)的系統(tǒng)監(jiān)控工具挺多,例如 zabbix、nagios、Prometheus,比如 最近比較火的是 Prometheus,本文先做個(gè)總體簡(jiǎn)介。另外還有一些應(yīng)用性能監(jiān)控軟件,比較知名的pinpoint、Zipkin、skywalking,更偏向于服務(wù)級(jí)/微服務(wù)級(jí)的監(jiān)控,本文不做介紹。
Prometheus 是一款系統(tǒng)和服務(wù)監(jiān)控軟件,是 Cloud Native Computing Foundation 目前的2個(gè)開源軟件之一,另一個(gè)是大名鼎鼎的 kubernetes,俗稱K8S,另外還有一些正在孵化中的項(xiàng)目,比如知名的 Fluentd ——一款聚合器,常被用來充當(dāng)Logstash 的替代工具,但 Fluentd 不是一個(gè)日志集成系統(tǒng)。
Grafana是一款數(shù)據(jù)看板工具,可以從多款數(shù)據(jù)源收集數(shù)據(jù)并展示,比如從Prometheus拉取數(shù)據(jù)并展示。
Alertmanager 是 Prometheus 官方提供的報(bào)警工具,用于接收 Prometheus 推送過來的報(bào)警信息,然后轉(zhuǎn)發(fā)到企業(yè)微信、釘釘?shù)瓤蛻舳恕?/p>
Prometheus 官方提供了一些常見的監(jiān)控指標(biāo)收集器,英文名叫 export,中文翻譯為 埋點(diǎn),還有一些常用的第三方提供的 export。

Prometheus架構(gòu)概述.png