1.系統(tǒng)假死
描述:系統(tǒng)假死指的是能ping通該服務器,但是不能ssh遠程連接
原因:可能由于有一個進程大量的fork子進程,造成了內(nèi)存被占滿,這時會觸發(fā)oomkill,系統(tǒng)就會隨機kill掉一個進程,然后父進程會立馬fork一個新的子進程接替工作,然后系統(tǒng)又會kill,這樣成了一個死循環(huán),都被沾滿,沒有ssh進程的空間了
解決辦法:提前將ssh優(yōu)先級提高,這時,ssh就可優(yōu)先使用cpu資源,就可鏈接上服務器將占用內(nèi)存高的進程kill掉
2.系統(tǒng)的sudo不能正常使用
描述:普通用戶使用chmod(可能chmod有suid權限)將 sudo命令進行修改,將其suid權限修改成為別的權限,再次使用sudo提權時,提示,sudo命令必須歸root所有,并且要設置suid,這之后使用sudo 不能進行正常的提權
解決辦法:所以可以進單用戶模式,將sudo權限改回來,設置一個suid,或者進入單用戶模式將root密碼改一下,然后通過root修改sudo命令的權限。
3.定時任務被刪除
描述:在定時任務里,員工不小心crontab -c 將所有的定時任務給刪除了,這里有許多的定時任務都是不同的人在這里設置的,有的可能刪除之后對公司業(yè)務造成虧損
解決辦法:可以通過cron日志(/var/log/cron)來分析日志嘗試解決,可以從時間間隔,操作命令等方面來嘗試恢復,無疑非常的浪費時間。
4.本地數(shù)據(jù)庫遷云
描述:將本地數(shù)據(jù)庫上傳至云數(shù)據(jù)庫時,會造成iowait時間變長,以至于平均負載變高,原來是云上所謂的高效云盤讀寫速度非常慢
解決辦法:需要換一個sas口的硬盤,io等待時間會立即降下來