預(yù)案是指根據(jù)評估分析或經(jīng)驗,對潛在的或可能發(fā)生的突發(fā)事件的類別和影響程度而事先制定的應(yīng)急處置方案。(from百度百科)

我自己對預(yù)案的理解:對重要&不可逆&影響重大的事件可能發(fā)生的低概率問題/意外(但一旦發(fā)生,損失會很大)制定的保障/備用方案。比如大型活動中話筒突然沒聲音、PPT無法播放等問題,在活動準備前期就考慮到發(fā)生這些問題怎么應(yīng)對解決就屬于做了預(yù)案(當然還存在預(yù)案是否充足,暫不討論)?,F(xiàn)在的重疾、意外保險其實也屬于預(yù)案,如果家庭經(jīng)濟支柱發(fā)生重疾或意外,對家庭經(jīng)濟影響極大,但是保險金額能在一定程度減輕經(jīng)濟壓力。
2018年有幾個印象比較深的case study(針對線上問題回顧如何發(fā)現(xiàn)、止損、排查、定位,以及討論后續(xù)如何避免的會議),一個是OP誤操作導(dǎo)致線上核心服務(wù)大規(guī)模不可用且止損時間超長;一個是上游放量未周知下游導(dǎo)致下游QPS過載,數(shù)據(jù)延遲,總結(jié)的幾個共同點:
NO DIFF/AB TEST
變更是否是無diff的,是否可以做A/B測試,如果無法保證那么就要做好預(yù)案,萬一當次變更不符合預(yù)期或造成線上有損,如何盡快止損,對于高危操作是否有double check機制?
想當然/信息不一致
有些變更需要跨多個團隊、上下游多個服務(wù),在可能影響上下游的變更中,是否提前周知上下游當次的變更,確認有無風(fēng)險,評估可能的影響?信息不一致情況下想當然的結(jié)果往往不那么盡如人意。
ownership/責(zé)任感
對于當次的變更有沒有考慮對上下游的影響,還是只考慮對自己負責(zé)模塊的影響,對整體服務(wù)的責(zé)任感/ownership薄弱也可能會給整體的目標(所有線上服務(wù)穩(wěn)定可用)帶來損失。
生活中需要預(yù)案的場景:
- 手機萬一不甚丟失,手機中重要的圖片/信息是否有備份?
- 工作電腦萬一損壞,重要資料是否有備份,能否不影響工作?
- 如果不甚失業(yè),家庭資金能支撐多久的日常支出?
- 資金多大比例用于投資,最多可以承擔(dān)多大的損失?
(好友小王大夫有位同事前段時間把自己所有錢都投到了另一位同事推薦的P2P理財里,以為好幾年都特別穩(wěn)定肯定沒問題,一個月后就可以取出來,無奈P2P暴雷,退款計劃遙遙無期;還有把換房全部首付投進去的,這種我理解這就是太想當然了,沒有對意外做好預(yù)案)