最近了解到一個東西,SRE。從DevOps角度我認為值得一看,章節(jié)不多,如果時間充足,計劃在7月開始5天看完。
中文版本下載地址 http://www.java1234.com/a/javabook/javabase/2017/0625/8352.html
SER介紹
SRE全稱:Site Reliability Engineering,翻譯過來就是:站點可靠性工程師。SRE的職責確保站定的可用,為了達到這個目的,他需要對站點涉及的系統(tǒng)、組件熟悉,需要關注生產運行時的狀態(tài),為此,他需要有很多工具和系統(tǒng)支撐其完成上述工作,比如自動化發(fā)布系統(tǒng),監(jiān)控系統(tǒng),日志系統(tǒng),服務器資源分配和編排等,這些工具需要他們自己完成開發(fā)和維護。
SRE是一個綜合素質很高的全能手,需要懂服務器基礎架構、操作系統(tǒng)、網絡、中間件容器、常用編程語言、全局的架構意識、非常強的問題分析能力、極高的抗壓能力(以便沉著高效地排障),他們還需要懂性能調優(yōu)理論...
SRE的工作是Develop+Operate的結合,SRE是DevOps的實踐者,他們的工作內容和職責和傳統(tǒng)運維工程師差不多:發(fā)布、部署、監(jiān)控、排障,目標一致。但是SRE的手段更加自動化,更高效,這種高效來源于自動化工具、監(jiān)控工具的支撐,更因為其作為這些工具的開發(fā)者,不斷優(yōu)化和調整,使整個工具箱使起來更加得心應手,這也是DevOps的魅力所在。