? ? ? ?系統(tǒng)故障也分正經(jīng)的和不正經(jīng)的?難道系統(tǒng)要故障還跟你商量?當(dāng)然,對(duì)那種故障的很有條理的,一路查下去可以查出故障原因,且在沒查出原因之前可快速恢復(fù)運(yùn)行的系統(tǒng)故障就是正經(jīng)的故障。那種反常理的,莫名其妙的,讓人摸不著頭腦的,且嘗試各種方式都無法恢復(fù)的系統(tǒng)故障就是不正經(jīng)的,是耍流氓的。
? ? ? ? 某日,某app故障了,電信和聯(lián)通的手機(jī)可正常打開app,唯獨(dú)移動(dòng)手機(jī)打不開,但是若手機(jī)連接移動(dòng)的wifi,又可以正常打開,就是移動(dòng)4G信號(hào)打不開app。

? ? ? ?那好吧,既然移動(dòng)4G用不了這個(gè)app,那么我在鏈路負(fù)載上把移動(dòng)關(guān)掉,讓移動(dòng)4G用戶通過電信或聯(lián)通網(wǎng)間互聯(lián)進(jìn)來總可以吧,結(jié)果發(fā)現(xiàn)還是不行。于是開始懷疑移動(dòng)線路有問題,這啥玩意?

? ? ? ? 移動(dòng)的技術(shù)人員排查后發(fā)現(xiàn)運(yùn)營商線路正常,沒啥問題。然后就通過抓包方式,在入口抗DDOS安全設(shè)備和鏈路負(fù)載抓包,對(duì)比數(shù)據(jù)包發(fā)現(xiàn)鏈路負(fù)載比入口抗DDOS安全設(shè)備報(bào)文少了,于是懷疑是抗DDOS攔截了正常流量。但是查看抗DDOS,又沒發(fā)現(xiàn)異常阻斷日志,也沒有攻擊,沒辦法認(rèn)定抗DDOS存在問題。
? ? ? ?后來懷疑運(yùn)行的鏈路負(fù)載有問題,就想做個(gè)主備切換,后來經(jīng)技術(shù)論證,認(rèn)為若鏈路負(fù)載有問題,不會(huì)針對(duì)某個(gè)運(yùn)營商用戶。最后決定把抗DDOS設(shè)備繞過,奇怪的是,繞過抗DDOS后app恢復(fù)正常。

? ? ? ?經(jīng)排查,該抗DDOS設(shè)備服役時(shí)間較長(zhǎng),存在較多不穩(wěn)定因素。雖然繞過抗DDOS后app正常運(yùn)行了,但是這樣裸跑也不行啊,為了保障系統(tǒng)安全,從庫房調(diào)用一臺(tái)新的抗DDOS設(shè)備用于DDOS清洗,替換撤下來的故障抗DDOS設(shè)備。所以,超期服役的設(shè)備該換還是得換啊,要不然哪天出個(gè)莫名奇妙的問題,要把自己玩死啊。