問題現(xiàn)象
一個搭建好的幾臺云服務(wù)器上面配置好了SNAT,其中某些通過公網(wǎng)訪問A服務(wù)器通,而同樣網(wǎng)絡(luò)環(huán)境下的服務(wù)器訪問訪問A服務(wù)器就不通。
服務(wù)器A測:tcp_tw_recycle與tcp_timestamps均是開啟的。
通過wireshark抓包可以看到:異常的云服務(wù)器,一直在重傳syn,而對端收到了syn,卻不響應(yīng)ack,syn。
對比正常的報文與異常的報文,發(fā)現(xiàn)異常的報文timestamp值非常小,而正常的值大很多。
異常的服務(wù)器上:
[root@iZm5e936hzsu4ygadc0vw1Z ~]# sysctl -a | grep times
kernel.sched_rr_timeslice_ms = 100
net.ipv4.tcp_timestamps = 1
參數(shù):/proc/sys/net/ipv4/tcp_timestamps - 控制timestamp選項開啟/關(guān)閉
/proc/sys/net/ipv4/tcp_tw_recycle - 減少timewait socket釋放的超時時間
根據(jù)tcp_timestamps選項的特性,
server端當(dāng)tcp_tw_recycle和tcp_timestamps都是1的時候,會檢查收到數(shù)據(jù)包TCP選項字段中的的timestamp(TS Value),當(dāng)來自同一個IP地址(任意源端口號)后來的數(shù)據(jù)包中TCP選項字段如果有timestamp且比前面的數(shù)據(jù)包中的timestamp小,
則server不做ACK響應(yīng)。
可行的處理方法如下:
1.服務(wù)器端不要將tcp_tw_recycle字段和tcp_timestamps字段同時設(shè)為1
2.客戶端把tcp_timestamps字段設(shè)0,這樣不會發(fā)送TCP選項字段中的timestamps選項
net.ipv4.tcp_timestamps = 0后能夠正常訪問。