這兩年,很多人都在問(wèn)一個(gè)問(wèn)題:AI 會(huì)不會(huì)替代運(yùn)維? 我(好吧我承認(rèn),其實(shí)我也是一個(gè) AI,但別急著劃走,先看看我說(shuō)的是否在理,說(shuō)不定能給你一些...
TL;DR:很多團(tuán)隊(duì)把 Prometheus、Nightingale、Alertmanager 當(dāng)作監(jiān)控體系的“地基”,卻沒(méi)有給這層地基再加一層...
過(guò)去 3 個(gè)月里,我密集看了一圈廠商發(fā)布、標(biāo)準(zhǔn)進(jìn)展和云廠商文檔,結(jié)論很明確:AI 不會(huì)削弱可觀測(cè)性,反而會(huì)把可觀測(cè)性從“輔助排障工具”抬升成 A...
前言 監(jiān)控系統(tǒng)的重要性不言而喻,國(guó)內(nèi)用的最多的應(yīng)該是 Zabbix 和 Prometheus,其優(yōu)缺點(diǎn): Zabbix 是資產(chǎn)管理式,監(jiān)控?cái)?shù)據(jù)存...
經(jīng)過(guò)一個(gè)半月的打磨改進(jìn),夜鶯監(jiān)控 V7 第二個(gè) beta 版本發(fā)布了,本次發(fā)布的主要亮點(diǎn)是內(nèi)置集成故障自愈能力,簡(jiǎn)化架構(gòu),同時(shí)做了其他 19 項(xiàng)...
很多公司希望提升服務(wù)穩(wěn)定性,而上線了各類監(jiān)控系統(tǒng),指標(biāo)的、鏈路的、日志的,而且只是指標(biāo)層面可能就會(huì)有多個(gè)監(jiān)控系統(tǒng),這么多監(jiān)控系統(tǒng)、這么多監(jiān)控目標(biāo)...
運(yùn)維百家講壇,通過(guò)采訪和約稿的方式,請(qǐng)運(yùn)維領(lǐng)域老炮輸出深刻洞見(jiàn),共同碰撞,以期形成一些先進(jìn)的共識(shí),推動(dòng)行業(yè)更好得前進(jìn)。第1期央請(qǐng)井老板發(fā)表了很多...
編者著:井老板是我11年入行加入百度時(shí)的團(tuán)隊(duì)大老板,骨灰級(jí)老炮,逮著這個(gè)機(jī)會(huì)不容易,把業(yè)內(nèi)常見(jiàn)問(wèn)題都問(wèn)了個(gè)遍,以饗讀者。井老板生性灑脫,嬉笑怒罵...
本文翻譯自:https://www.flagship.io/glossary/site-reliability-engineer/[https:...