這里說的運(yùn)維主要是指應(yīng)用運(yùn)維,非系統(tǒng)部的偏硬件和網(wǎng)絡(luò)的運(yùn)維
我不快樂
很多運(yùn)維同學(xué)感覺自己很苦逼,感覺每天都在救火,給研發(fā)擦屁股,做一些重復(fù)工作,做一些對自己提升較小的事情,總結(jié)一句話,就是不幸福。
怎么快樂
工作中的幸福主要來自兩點(diǎn):
1、有成就感;
2、薪水到位;
而薪水到位與否很大程度決定于你的產(chǎn)出(如果你的老板不懂你們的工作,看不到本該看到的價值,那另當(dāng)別論),而產(chǎn)出多少很大程度上和你的成就感是正相關(guān)的,所以要幸福,就要做有成就感的事情。
談成就感
作為一個技術(shù)人員,成就感主要來自兩點(diǎn):
1、做的有價值
2、被別人認(rèn)同
對于研發(fā)同學(xué),比如寫了一個framework,或者lib,同事都說好,并拿去用,這個時候是超級有成就感的;或者做的產(chǎn)品被市場認(rèn)可,被同行認(rèn)可,也是很有成就感的。
那運(yùn)維同學(xué)呢?價值體現(xiàn)在哪里?
運(yùn)維的價值
可以分對內(nèi)的,和對外的。比如運(yùn)維同學(xué)寫了一些運(yùn)維工具,大大提升了做某些事情的效率,得到周邊同學(xué)的認(rèn)可,這是對內(nèi)的價值。這里,筆者更希望好好探討一下對外的價值,運(yùn)維這個角色,在公司的定位,對公司的價值。
多數(shù)公司在創(chuàng)業(yè)之初,是沒有運(yùn)維這個角色的,相關(guān)工作內(nèi)容由所謂的全棧工程師、棧溢出工程師代勞。隨著公司規(guī)模擴(kuò)大,機(jī)器到幾百臺,會暴露出N多問題,比較直觀的比如:
????????1、線上環(huán)境混亂不堪,OS發(fā)行版、系統(tǒng)參數(shù)配置、WEB服務(wù)器、啟停方式、部署路徑全憑各服務(wù)的研發(fā)人員的喜好和熟悉程度
????????2、監(jiān)控各種不完備,很多故障都是后于用戶發(fā)現(xiàn),有些進(jìn)程掛了好久才偶然發(fā)現(xiàn)或用戶報障了才發(fā)現(xiàn)
????????3、出了故障排查費(fèi)勁,甚至在線上調(diào)試
????????4、很多故障都是由一些低級問題導(dǎo)致,比如ulimit配置不合理,比如想回滾卻發(fā)現(xiàn)忘記備份
????????5、服務(wù)器資源利用率低,很多機(jī)器根本沒在用,甚至都找不到了,浪費(fèi)了大量硬件成本
????????6、同時操作大量機(jī)器缺乏有力工具,線上權(quán)限要么混亂不堪,要么所有人有所有機(jī)器的權(quán)限
技術(shù)合伙人意識到:靠專注寫業(yè)務(wù)邏輯的研發(fā)人員來解決這些問題是不靠譜的,需要設(shè)置一個新的職能團(tuán)隊(duì)來收拾這個爛攤子。
于是,運(yùn)維團(tuán)隊(duì)?wèi)?yīng)運(yùn)而生,定位就是:解決上面提到的問題。換個說法:讓研發(fā)只專注業(yè)務(wù)邏輯和架構(gòu)設(shè)計(jì),運(yùn)維搞定剩下的。這樣會帶來以下好處:
????● ?產(chǎn)品更快得到驗(yàn)證:解放了研發(fā)人力,研發(fā)同學(xué)就可以全身心撲在產(chǎn)品開發(fā)上,迭代速度會變快
????● ?大幅提升服務(wù)穩(wěn)定性:專業(yè)的人干專業(yè)的事,線上環(huán)境規(guī)范干凈了,監(jiān)控完備了,沒有低級錯誤了,系統(tǒng)參數(shù)配置合理了
????● ?資產(chǎn)得到有效利用:資產(chǎn)專門有人在梳理,通過服務(wù)混部等手段提高利用率,再也沒有機(jī)器在空轉(zhuǎn)
用一句話來概況運(yùn)維的價值:
花更少的錢,讓產(chǎn)品更快迭代,更穩(wěn)定運(yùn)行
有些運(yùn)維同仁概況了運(yùn)維九字真言“安全穩(wěn)定高效低成本”,說的非常到位。其中的安全,行文到此尚未介紹到,有些公司會把安全單拎出來成立安全部,有些就直接放在運(yùn)維團(tuán)隊(duì),這個看公司情況,如果公司體量大,個人認(rèn)為,還是單拎出來會好一些。
目標(biāo)拆解
安全、穩(wěn)定、高效、低成本,怎么才能把這四大目標(biāo)做好?應(yīng)該做哪些事情來達(dá)成目標(biāo)?筆者用一張腦圖來梳理一下:
