周日的早晨本應該舒舒服服睡個懶覺,然而自從有了孩子以后就再也沒有享受過如此待遇。7點多揉著朦朧的睡臉的到隔壁屋子拿起正在充電的手機,發(fā)現(xiàn)有個未接來電,時間凌晨1:30,某東打來的,小心臟咚的一聲,然后菊花一緊…隱隱感覺要出事,趕緊一個電話撥了過去…
一個小前奏:昨天帶兒子去上英語課,途中接到隔壁老王電話,有臺oracle數(shù)據(jù)庫掛了,牽連了幾個直接用oracle的系統(tǒng),間接的影響了其他有業(yè)務關聯(lián)的系統(tǒng)…事情有點嚴重,關鍵是沒人能夠恢復這個受傷的數(shù)據(jù)庫…掛了電話趕緊登錄一把,系統(tǒng)確實訪問不了了,心里一陣慌亂,定了定神,系統(tǒng)爛了找廠家找開發(fā),服務器down了找運維,我一個搞需求的操啥心…或許是自己已然成了驚弓之鳥…過了幾分鐘,群里有人報系統(tǒng)訪問不了…又過了幾分鐘運維回復系統(tǒng)恢復了,又趕緊登錄一把,確實正常了…這才踏實的把孩子送到教室去…
早上打通了某東電話,顯然是還沒睡醒的聲音。大意是試運行的a系統(tǒng)有兩個服務,頻繁操作數(shù)據(jù)庫,把oracle拖掛了,最終影響了所有使用該數(shù)據(jù)庫的系統(tǒng)。問題排查過程也是遇到了各種奇葩的事:
1、a系統(tǒng)用了b系統(tǒng)數(shù)據(jù)庫賬號連了oracle…
2、a系統(tǒng)服務用了b系統(tǒng)用戶名c…
3、把用戶名為c的服務器關了居然仍然存在c用戶連接數(shù)據(jù)庫…
4、再一查,有n個用戶名為c的克隆機…
最終根據(jù)ip找到了那臺有問題的服務器,停了之后整個世界終于都清凈了…索性這次事件沒有造成太大影響,但臨近結束某東強調要時刻保持電話處于待機狀態(tài)…
個人心里有太多羊駝在嚎叫。雞蛋不能放在一個籃子里是大家都知道的道理;如果確實籃子有限,為何不給籃子上幾個保險措施,籃子破了也不至于雞蛋全打了;拎雞蛋的明明是個孩子,還要弄那么多給他拎著…
仰天長嘆,自己略用過幾年oracle,只是懂點增刪改查,前段時間淺研了下oracle下的sql性能調優(yōu),面對oracle掛了這事確實還是束手無策?;蛟S真的該好好學習下,對于一個33歲的過氣程序員,做個oracle數(shù)據(jù)庫dba也不失為一條好的去路…