[mysql5.7 報錯Got an error reading communication packets 關(guān)于Aborted connection告警日志的分析 ]
經(jīng)查閱資料得知:
1.mysql5.7的log_warnings默認值是2,
log_warnings的值為0,表示不記錄警告信息。
log_warnings的值為1,表示警告信息一并記錄到錯誤日志中。
log_warnings的值大于1,表示"失敗的連接"的信息和創(chuàng)建新連接時"拒絕訪問"類的錯誤信息也會被記錄到錯誤日志中。【實際生成環(huán)境值設(shè)為2會影響正常程序的連接,經(jīng)常會斷開與mysql的連接】
mysql5.5中l(wèi)og_warnings參數(shù)的默認值為1
mysql5.7中l(wèi)og_warnings參數(shù)的默認值為2
2.在線修改**log_warnings的值:
mysql> select @@log_warnings;
+----------------+
| @@log_warnings |
+----------------+
| 2 |
+----------------+
1 row in set, 1 warning (0.00 sec)
mysql> **set global log_warnings=1;
Query OK, 0 rows affected, 1 warning (0.00 sec)
3.但這樣直接修改,重啟后會失效,修改配置文件mysql.cnf
log_warnings = 1
前言:
有時候,連接mysql的會話經(jīng)常會異常退出,錯誤日志里會看到"Got an error reading communication packets"類型的告警。本篇文章我們一起來討論下該錯誤可能的原因以及如何來規(guī)避。
1.狀態(tài)變量Aborted_clients和Aborted_connects
首先我們來了解下Aborted_clients和Aborted_connects這兩個狀態(tài)變量的含義,當(dāng)出現(xiàn)會話異常退出時,這兩個狀態(tài)值會有變化。根據(jù)官方文檔描述,總結(jié)如下:
造成Aborted_connects狀態(tài)變量增加的可能原因:
- 客戶端試圖訪問數(shù)據(jù)庫,但沒有數(shù)據(jù)庫的權(quán)限。
- 客戶端使用了錯誤的密碼。
- 連接包不包含正確的信息。
- 獲取一個連接包需要的時間超過connect_timeout秒。
造成Aborted_clients狀態(tài)變量增加的可能原因:
- 程序退出前,客戶機程序沒有調(diào)用mysql_close()。
- 客戶端睡眠時間超過了wait_timeout或interactive_timeout參數(shù)的秒數(shù)。
- 客戶端程序在數(shù)據(jù)傳輸過程中突然終止。
簡單來說即:數(shù)據(jù)庫會話未能正常連接到數(shù)據(jù)庫,會造成Aborted_connects變量增加。數(shù)據(jù)庫會話已正常連接到數(shù)據(jù)庫但未能正常退出,會造成Aborted_clients變量增加。
2.Got an error reading communication packets原因分析
哪種情況會導(dǎo)致error log中出現(xiàn)“Aborted connection xxxx to db: 'db' user: 'dbuser' host: 'hostname' (Got an error reading communication packets)”類似告警呢?下面我們根據(jù)上面可能的原因來做下具體測試。每次測試要注意狀態(tài)變量Aborted_clients和Aborted_connects的變化及錯誤日志記錄。
- 測試一:錯誤密碼,錯誤用戶
1.測試前查看狀態(tài)變量值
mysql> show global status like 'abort%';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| Aborted_clients | 0 |
| Aborted_connects | 0 |
+------------------+-------+
2.測試過程
mysql -uroot -pwrongpass
mysql: [Warning] Using a password on the command line interface can be insecure.
ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)
mysql -uroot1 -pwrongpass
mysql: [Warning] Using a password on the command line interface can be insecure.
ERROR 1045 (28000): Access denied for user 'root1'@'localhost' (using password: YES)
3.查看狀態(tài)變化及錯誤日志
mysql> show global status like 'abort%';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| Aborted_clients | 0 |
| Aborted_connects | 2 |
+------------------+-------+
錯誤日志記錄:
2020-03-16T17:58:35.318819+08:00 6 [Note] Access denied for user 'root'@'localhost' (using password: YES)
2020-03-16T17:59:04.153753+08:00 7 [Note] Access denied for user 'root1'@'localhost' (using password: YES)
結(jié)果:Aborted_connects有增加, error log無Aborted connection相關(guān)記錄
- 測試二:睡眠時間超時或手動殺會話
1.測試前查看狀態(tài)變量值
mysql> show global status like 'abort%';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| Aborted_clients | 0 |
| Aborted_connects | 2 |
+------------------+-------+
2.手動殺會話測試
mysql> show processlist;
+----+------+-----------+------+---------+------+----------+------------------+
| Id | User | Host | db | Command | Time | State | Info |
+----+------+-----------+------+---------+------+----------+------------------+
| 9 | root | localhost | NULL | Query | 0 | starting | show processlist |
| 10 | root | localhost | NULL | Sleep | 7 | | NULL |
+----+------+-----------+------+---------+------+----------+------------------+
2 rows in set (0.00 sec)
mysql> kill 10;
Query OK, 0 rows affected (0.00 sec)
3.查看狀態(tài)變化及錯誤日志
mysql> show global status like 'abort%';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| Aborted_clients | 1 |
| Aborted_connects | 2 |
+------------------+-------+
結(jié)果:Aborted_clients有增加 error log無記錄 ,類似的,睡眠時間超時后Aborted_clients有增加 error log中有Aborted connection相關(guān)記錄。
會話異常退出一般會造成Aborted connection告警,即我們可以通過Aborted_clients狀態(tài)變量的變化來反映出是否存在異常會話,那么出現(xiàn)“*Got an error reading communication packets” *類似告警的原因就很明了了,查詢相關(guān)資料,總結(jié)出造成Aborted connection告警的可能原因如下:
- 會話鏈接未正常關(guān)閉,程序沒有調(diào)用mysql_close()。
- 睡眠時間超過wait_timeout或interactive_timeout參數(shù)的秒數(shù)。
- 查詢數(shù)據(jù)包大小超過max_allowed_packet數(shù)值,造成鏈接中斷。
- 其他網(wǎng)絡(luò)或者硬件層面的問題。
3.問題避免與總結(jié)
其實Aborted connection告警是很難避免的,error log里或多或少會有少量Aborted connection信息,這種情況是可以忽略的,但是當(dāng)你的error log里頻繁出現(xiàn)Aborted connection告警,這時候就應(yīng)該注意了,可能會對業(yè)務(wù)產(chǎn)生較大的影響。下面列舉出幾點避免錯誤的建議,希望對你有所幫助。
- 建議業(yè)務(wù)操作結(jié)束后,應(yīng)用程序邏輯會正確關(guān)閉連接,以短連接替代長連接。
- 檢查以確保max_allowed_packet的值足夠高,并且客戶端沒有收到“數(shù)據(jù)包太大”消息。
- 確保客戶端應(yīng)用程序不中止連接,例如,如果PHP設(shè)置了max_execution_time為5秒,增加connect_timeout并不會起到作用,因為PHP會kill腳本。其他程序語言和環(huán)境也有類似的安全選項。
- 確保事務(wù)提交(begin和commit)都正確提交以保證一旦應(yīng)用程序完成以后留下的連接是處于干凈的狀態(tài)。
- 檢查是否啟用了skip-name-resolve,檢查主機根據(jù)其IP地址而不是其主機名進行身份驗證。
- 嘗試增加MySQL的net_read_timeout和net_write_timeout值,看看是否減少了錯誤的數(shù)量。