架構(gòu)設(shè)計(jì)讀書筆記-高可用(二)- FEMA

FMEA方法

FMEA(Failure mode and effects analysis,故障模式與影響分析),F(xiàn)MEA 是一種在各行各業(yè)都有廣泛應(yīng)用的可用性分析方法,通過對系統(tǒng)范圍內(nèi)潛在的故障模式加以分析,并按照嚴(yán)重程度進(jìn)行分類,以確定失效對于系統(tǒng)的最終影響。

具體分析方法

  • 給出初始的架構(gòu)設(shè)計(jì)圖。

  • 假設(shè)架構(gòu)中某個(gè)部件發(fā)生故障。

  • 分析此故障對系統(tǒng)功能造成的影響。

  • 根據(jù)分析結(jié)果,判斷架構(gòu)是否需要進(jìn)行優(yōu)化。

FMEA分析表

其實(shí),就是一個(gè)FMEA分析表,表格包含下面部分

功能點(diǎn): 用戶的角度,而不是系統(tǒng)各個(gè)模塊的功能點(diǎn)劃分

故障模式: 精確、量化,避免泛華

故障影響: 故障模式造成的功能點(diǎn)的具體影響,準(zhǔn)確描述

嚴(yán)重程度: 業(yè)務(wù)角度看,一般按程度分為“致命、高、中、低、無(優(yōu)化)”

故障原因:概率不相同、檢測手段不一樣、處理措施不一樣

故障概率:根據(jù)故障原因,概率一般按高中低三檔劃分

風(fēng)險(xiǎn)程度:綜合嚴(yán)重程度加故障概率判斷

已有措施:已有的如檢測告警、容錯(cuò)、自恢復(fù)等。不一定所有問題都需要解決,規(guī)避措施也可以

規(guī)避措施:降低故障概率的技術(shù)或管理手段

解決措施:一般是通過技術(shù)手段進(jìn)行修復(fù)

后續(xù)規(guī)劃:綜合已有、規(guī)避、解決措施,結(jié)合風(fēng)險(xiǎn)程度進(jìn)行優(yōu)先級排序,規(guī)劃問題解決計(jì)劃

FMEA實(shí)戰(zhàn)

簡單的用戶管理系統(tǒng),包含登陸和注冊兩個(gè)功能,初始架構(gòu):


初始架構(gòu)

FEMA表格如下:

功能點(diǎn) 故障模式 故障影響 嚴(yán)重程度 故障原因 故障概率 風(fēng)險(xiǎn)程度 已有措施 規(guī)避措施 解決措施 后續(xù)規(guī)劃
登陸 Mysql無法訪問 當(dāng)MC中無緩存,預(yù)計(jì)有60%用戶無法登陸 Mysql服務(wù)器斷電 增加備份Mysql
登陸 同上 同上 Server到Mysql網(wǎng)絡(luò)連接中斷 Mysql雙網(wǎng)卡連接
登陸 Mysql響應(yīng)時(shí)間超過5s 60%用戶登陸時(shí)間超過5s 慢查詢導(dǎo)致Mysql運(yùn)行緩慢 慢查詢檢測 重啟Mysql 不需要
登陸 MC無法訪問 所有用戶都到Mysql查詢信息,Mysql壓力增大,響應(yīng)變慢 低,慢,但是能登陸 MC服務(wù)器斷電 MC集群
注冊 Mysql無法訪問 用戶無法注冊 低,新注冊用戶少,每天只有100個(gè) Mysql服務(wù)器斷電 無,因?yàn)樵黾觽浞輽C(jī)器,也無法作為主機(jī)寫入
注冊 MC無法訪問 無影響,用戶注冊不操作MC MC服務(wù)器斷電 不需要

由此主要改進(jìn)措施為:

  • Mysql增加備機(jī)

  • MC從單機(jī)擴(kuò)展為集群

  • Mysql雙網(wǎng)卡連接

改進(jìn)后的架構(gòu):


改進(jìn)架構(gòu)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容