起因:大面積機(jī)頂盒點(diǎn)播故障#
最怕遇到的問題就是大量用戶的隨機(jī)故障,偏偏又遇到了。一個分前端機(jī)房下屬的大量用戶報(bào)點(diǎn)播故障。一線報(bào)過來的故障現(xiàn)象又混亂,有說點(diǎn)不了,有說點(diǎn)播頁面進(jìn)不了,不一而足,于是更難判斷故障。
定性:雙向網(wǎng)故障#
先查IPQAM,看上去都好的。報(bào)省網(wǎng)查VOD平臺,一如既往的石沉大海。Ping機(jī)頂盒IP有些通,有些不通,一會兒通,一會兒不通,最頭疼的隨機(jī)故障。
只好搬出FPing大招,對整個網(wǎng)段狂掃,數(shù)百IP只有個別地址羞羞答答的露個頭,絕大多數(shù)都不可達(dá)。再掃幾次,還是多數(shù)IP還是愛搭不理,更奇怪的是,能Ping通的IP每次都不一樣,麻煩的隨機(jī)故障。
排障:EOC貓環(huán)路#
去查網(wǎng)關(guān),網(wǎng)關(guān)及以上路由一路暢通。網(wǎng)關(guān)側(cè)貌似廣播包有點(diǎn)大,可能是廣播風(fēng)暴。于是網(wǎng)關(guān)往下擼,PON口,ONU,真找到一個EOC上來的廣播報(bào)文特別多。于是試著關(guān)了ONU,F(xiàn)Ping馬上如絲般順快爽滑。打開ONU,終端馬上又吭哧吭哧出不來。蓋棺定論,罪魁禍?zhǔn)拙褪撬恕?br> 通知一線,找到用戶家,EOC貓的兩個口被一根網(wǎng)線環(huán)起來了。
總結(jié):幾個隱患#
- EOC貓兩個口同VLAN
當(dāng)年為了業(yè)務(wù)方便,營銷口要求這么做,技術(shù)口沒有堅(jiān)持,所以留下隱患 - ONU廣播包限流效果不好
ONU都做了廣播包限流的,無奈設(shè)備就是限不住,廠家也給不出說法