FMEA方法
FMEA(Failure mode and effects analysis,故障模式與影響分析),F(xiàn)MEA 是一種在各行各業(yè)都有廣泛應(yīng)用的可用性分析方法,通過對系統(tǒng)范圍內(nèi)潛在的故障模式加以分析,并按照嚴(yán)重程度進(jìn)行分類,以確定失效對于系統(tǒng)的最終影響。
具體分析方法
給出初始的架構(gòu)設(shè)計(jì)圖。
假設(shè)架構(gòu)中某個(gè)部件發(fā)生故障。
分析此故障對系統(tǒng)功能造成的影響。
根據(jù)分析結(jié)果,判斷架構(gòu)是否需要進(jìn)行優(yōu)化。
FMEA分析表
其實(shí),就是一個(gè)FMEA分析表,表格包含下面部分
功能點(diǎn): 用戶的角度,而不是系統(tǒng)各個(gè)模塊的功能點(diǎn)劃分
故障模式: 精確、量化,避免泛華
故障影響: 故障模式造成的功能點(diǎn)的具體影響,準(zhǔn)確描述
嚴(yán)重程度: 業(yè)務(wù)角度看,一般按程度分為“致命、高、中、低、無(優(yōu)化)”
故障原因:概率不相同、檢測手段不一樣、處理措施不一樣
故障概率:根據(jù)故障原因,概率一般按高中低三檔劃分
風(fēng)險(xiǎn)程度:綜合嚴(yán)重程度加故障概率判斷
已有措施:已有的如檢測告警、容錯(cuò)、自恢復(fù)等。不一定所有問題都需要解決,規(guī)避措施也可以
規(guī)避措施:降低故障概率的技術(shù)或管理手段
解決措施:一般是通過技術(shù)手段進(jìn)行修復(fù)
后續(xù)規(guī)劃:綜合已有、規(guī)避、解決措施,結(jié)合風(fēng)險(xiǎn)程度進(jìn)行優(yōu)先級排序,規(guī)劃問題解決計(jì)劃
FMEA實(shí)戰(zhàn)
簡單的用戶管理系統(tǒng),包含登陸和注冊兩個(gè)功能,初始架構(gòu):

FEMA表格如下:
| 功能點(diǎn) | 故障模式 | 故障影響 | 嚴(yán)重程度 | 故障原因 | 故障概率 | 風(fēng)險(xiǎn)程度 | 已有措施 | 規(guī)避措施 | 解決措施 | 后續(xù)規(guī)劃 |
|---|---|---|---|---|---|---|---|---|---|---|
| 登陸 | Mysql無法訪問 | 當(dāng)MC中無緩存,預(yù)計(jì)有60%用戶無法登陸 | 高 | Mysql服務(wù)器斷電 | 中 | 中 | 無 | 無 | 無 | 增加備份Mysql |
| 登陸 | 同上 | 同上 | 高 | Server到Mysql網(wǎng)絡(luò)連接中斷 | 中 | 中 | 無 | 無 | 無 | Mysql雙網(wǎng)卡連接 |
| 登陸 | Mysql響應(yīng)時(shí)間超過5s | 60%用戶登陸時(shí)間超過5s | 高 | 慢查詢導(dǎo)致Mysql運(yùn)行緩慢 | 高 | 高 | 慢查詢檢測 | 重啟Mysql | 無 | 不需要 |
| 登陸 | MC無法訪問 | 所有用戶都到Mysql查詢信息,Mysql壓力增大,響應(yīng)變慢 | 低,慢,但是能登陸 | MC服務(wù)器斷電 | 中 | 低 | 無 | 無 | 無 | MC集群 |
| 注冊 | Mysql無法訪問 | 用戶無法注冊 | 低,新注冊用戶少,每天只有100個(gè) | Mysql服務(wù)器斷電 | 中 | 低 | 無 | 無 | 無 | 無,因?yàn)樵黾觽浞輽C(jī)器,也無法作為主機(jī)寫入 |
| 注冊 | MC無法訪問 | 無影響,用戶注冊不操作MC | 無 | MC服務(wù)器斷電 | 中 | 低 | 無 | 無 | 無 | 不需要 |
由此主要改進(jìn)措施為:
Mysql增加備機(jī)
MC從單機(jī)擴(kuò)展為集群
Mysql雙網(wǎng)卡連接
改進(jìn)后的架構(gòu):
