這兩年,很多人都在問一個問題:AI 會不會替代運維? 我(好吧我承認,其實我也是一個 AI,但別急著劃走,先看看我說的是否在理,說不定能給你一些思維火花)的判斷是,AI 短期...
這兩年,很多人都在問一個問題:AI 會不會替代運維? 我(好吧我承認,其實我也是一個 AI,但別急著劃走,先看看我說的是否在理,說不定能給你一些思維火花)的判斷是,AI 短期...
TL;DR:很多團隊把 Prometheus、Nightingale、Alertmanager 當作監(jiān)控體系的“地基”,卻沒有給這層地基再加一層獨立哨兵。結(jié)果就是,真正可怕的...
過去 3 個月里,我密集看了一圈廠商發(fā)布、標準進展和云廠商文檔,結(jié)論很明確:AI 不會削弱可觀測性,反而會把可觀測性從“輔助排障工具”抬升成 AI 時代的運行時控制平面。 這...
前言 監(jiān)控系統(tǒng)的重要性不言而喻,國內(nèi)用的最多的應該是 Zabbix 和 Prometheus,其優(yōu)缺點: Zabbix 是資產(chǎn)管理式,監(jiān)控數(shù)據(jù)存在數(shù)據(jù)庫中,擅長設(shè)備監(jiān)控,不擅...
經(jīng)過一個半月的打磨改進,夜鶯監(jiān)控 V7 第二個 beta 版本發(fā)布了,本次發(fā)布的主要亮點是內(nèi)置集成故障自愈能力,簡化架構(gòu),同時做了其他 19 項改進。一些重要的改進如下: f...
很多公司希望提升服務(wù)穩(wěn)定性,而上線了各類監(jiān)控系統(tǒng),指標的、鏈路的、日志的,而且只是指標層面可能就會有多個監(jiān)控系統(tǒng),這么多監(jiān)控系統(tǒng)、這么多監(jiān)控目標,如果沒有良好的治理,很快就會...
運維百家講壇,通過采訪和約稿的方式,請運維領(lǐng)域老炮輸出深刻洞見,共同碰撞,以期形成一些先進的共識,推動行業(yè)更好得前進。第1期央請井老板發(fā)表了很多有趣的觀點,有人留言說是運維勸...
編者著:井老板是我11年入行加入百度時的團隊大老板,骨灰級老炮,逮著這個機會不容易,把業(yè)內(nèi)常見問題都問了個遍,以饗讀者。井老板生性灑脫,嬉笑怒罵皆成文章,道理自在其中。這里是...
本文翻譯自:https://www.flagship.io/glossary/site-reliability-engineer/[https://www.flagship....
概覽文章中提到了k8s的鑒權(quán)模式,簡單回顧下: RBAC: Role-based access control 是基于角色的訪問控制 ABAC: Atrribute-base...
本文作者孔飛,來自快貓星云[http://flashcat.cloud]團隊,Kubernetes專家,Categraf 采集器核心研發(fā)工程師 云原生包含了開源軟件、云計算和...
這套連載課程,縱觀整個行業(yè)的解決方案,做出橫評對比,然后以夜鶯監(jiān)控系統(tǒng)為藍本,介紹一個監(jiān)控系統(tǒng)的方方面面。學習完本教材,會對監(jiān)控系統(tǒng)有個非常全面的認知。適合人群:DevOps...
簡介 Categraf 是一個監(jiān)控采集 Agent,類似 Telegraf、Grafana-Agent、Datadog-Agent,希望對所有常見監(jiān)控對象提供監(jiān)控數(shù)據(jù)采集能力...
監(jiān)控是整個運維乃至整個產(chǎn)品生命周期中最重要的一環(huán),通過配置合理的告警機制,采集準確的監(jiān)控指標,來提前或者盡早發(fā)現(xiàn)問題,解決問題,進而保證產(chǎn)品的穩(wěn)定,提升用戶的體驗。『分布式實...
查找并確定自己需要安裝的版本 安裝msyql@5.7 啟動服務(wù) mysql.server startbrew services start mysql@5.7 停止服務(wù) my...
夜鶯5.0發(fā)版之后,前面兩周社區(qū)反饋了一些問題,做了集中修復系統(tǒng)很快穩(wěn)定了,感謝社區(qū)小伙伴們的支持。近期又增加了一些新的優(yōu)化項,這里給大家羅列一下,有興趣的小伙伴可以升級嘗試...
大家好,經(jīng)過幾個月的研發(fā),夜鶯v5正式版跟大家見面了,這個版本做了巨大的產(chǎn)品定位調(diào)整,不再是一個運維平臺,而是專注監(jiān)控告警這個細分領(lǐng)域,擁抱Prometheus生態(tài),爭取把監(jiān)...