久久久无码人妻精品,av全球日韩在线观看,性爱精品在线一区

注：本文轉(zhuǎn)載自阿里技術(shù)

阿里妹導讀：本文是一個理論過度到實踐的典型案例，借助程序員經(jīng)常遇到的一個問題——網(wǎng)絡(luò)為什么不通，來具體說明怎么將書本上的死知識真正變成我們解決問題的能力。

大學學到的基本概念

我相信你腦子里關(guān)于網(wǎng)絡(luò)基礎(chǔ)知識的概念都在下面這張圖中。知識內(nèi)容有點亂，感覺都認識，又都模模糊糊，更談不上將內(nèi)容轉(zhuǎn)化成生產(chǎn)力或是用來解決實際問題了。這是因為知識沒有貫通、沒有實踐、沒有組織。

image

上圖中知識點的作用在RFC1180[1]中講得無比通俗易懂了?？吹谝槐榈臅r候也許你就看懂了，但是一個月后又忘記了。其實這些東西我們在大學也學過，但還是忘了（能夠理解，缺少實操環(huán)境和條件），或者碰到問題才發(fā)現(xiàn)之前看懂了的東西其實沒懂。

所以接下來我們將示范書本知識到實踐的貫通過程，希望把網(wǎng)絡(luò)概念之間的聯(lián)系通過實踐來組織起來。

還是從一個問題入手

最近的環(huán)境碰到一個網(wǎng)絡(luò)ping不通的問題，當時的網(wǎng)絡(luò)鏈路是（大概是這樣，略有簡化）：

image

現(xiàn)象

從容器1 ping 物理機2 不通；
從物理機1上的容器2 ping物理機2 通；
同時發(fā)現(xiàn)即使是通的，有的容器 ping物理機1只需要0.1ms，有的容器需要200ms以上（都在同一個物理機上），不合理；
所有容器 ping 其它外網(wǎng)IP（比如百度）反而是通的。

這個問題扯了一周才解決是因為容器的網(wǎng)絡(luò)是我們自己配置的，交換機我們沒有權(quán)限接觸，由客戶配置。出問題的時候都會覺得自己沒問題對方有問題，另外就是對網(wǎng)絡(luò)基本知識認識不夠，所以都覺得自己沒問題而不去找證據(jù)。

這個問題的答案在大家看完本文的基礎(chǔ)知識后會總結(jié)出來。

解決這個問題前大家先想想，假如有個面試題是：輸入 ping IP 后敲回車，然后發(fā)生了什么？

復習一下大學課本中的知識點

要解決一個問題你首先要有基礎(chǔ)知識，在知識欠缺的情況下就算邏輯再好、思路再清晰、智商再高，也不一定有效。

route 路由表

image

假如你在這臺機器上ping 172.17.0.2 ，根據(jù)上面
2這個IP符合下面這條路由：

image

這條路由規(guī)則，那么ping 包會從docker0這張網(wǎng)卡發(fā)出去。

但是如果是ping 1.1.4.4 根據(jù)路由規(guī)則就應該走eth0這張網(wǎng)卡而不是docker0了。接下來就要判斷目標IP是否在同一個子網(wǎng)了。

ifconfig

首先來看看這臺機器的網(wǎng)卡情況：

image

這里有三個網(wǎng)卡和三個IP，三個子網(wǎng)掩碼（netmask)。根據(jù)目標路由走哪張網(wǎng)卡，得到這個網(wǎng)卡的子網(wǎng)掩碼，來計算目標IP是否在這個子網(wǎng)內(nèi)。

arp協(xié)議

網(wǎng)絡(luò)包在物理層傳輸?shù)臅r候依賴的mac 地址而不是上面的IP地址，也就是根據(jù)mac地址來決定把包發(fā)到哪里去。

arp協(xié)議就是查詢某個IP地址的mac地址是多少，由于這種對應關(guān)系一般不太變化，所以每個os都有一份arp緩存（一般15分鐘過期），也可以手工清理，下面是arp緩存的內(nèi)容：

image

進入正題，回車后發(fā)生什么？

有了上面的基礎(chǔ)知識打底，我們來思考一下 ping IP 到底發(fā)生了什么。

首先 OS 的協(xié)議棧需要把ping命令封成一個icmp包，要填上包頭（包括src-IP、mac地址），那么OS先根據(jù)目標IP和本機的route規(guī)則計算使用哪個interface(網(wǎng)卡），確定了路由也就基本上知道發(fā)送包的src-ip和src-mac了。每條路由規(guī)則基本都包含目標IP范圍、網(wǎng)關(guān)、MAC地址、網(wǎng)卡這樣幾個基本元素。

如果目標IP和本機使用的IP在同一子網(wǎng)

如果目標IP和本機IP是同一個子網(wǎng)（根據(jù)本機ifconfig上的每個網(wǎng)卡的netmask來判斷是否是同一個子網(wǎng)——知識點：子網(wǎng)掩碼的作用），并且本機arp緩存沒有這條IP對應的mac記錄，那么給整個子網(wǎng)的所有機器廣播發(fā)送一個 arp查詢，比如我ping 1.1.3.42，然后tcpdump抓包首先看到的是一個arp請求：

image

上面就是本機發(fā)送廣播消息，1.1.3.42的mac地址是多少？很快1.1.3.42回復了自己的mac地址。收到這個回復后，先緩存起來，下個ping包就不需要再次發(fā)arp廣播了。然后將這個mac地址填寫到ping包的包頭的目標Mac（icmp包），然后發(fā)出這個icmp request包，按照mac地址，正確到達目標機器，然后對方正確回復icmp reply（對方回復也要查路由規(guī)則，arp查發(fā)送方的mac，這樣回包才能正確路由回來，略過）。

來看一次完整的ping 1.1.3.43，tcpdump抓包結(jié)果：

image

我換了個IP地址，接著再ping同一個IP地址，arp有緩存了就看不到arp廣播查詢過程了。

如果目標IP不是同一個子網(wǎng)

arp只是同一子網(wǎng)廣播查詢，如果目標IP不是同一子網(wǎng)的話就要經(jīng)過本IP網(wǎng)關(guān)進行轉(zhuǎn)發(fā)(知識點：網(wǎng)關(guān)的作用)。如果本機沒有緩存網(wǎng)關(guān)mac（一般肯定緩存了），那么先發(fā)送一次arp查詢網(wǎng)關(guān)的mac，然后流程跟上面一樣，只是這個icmp包發(fā)到網(wǎng)關(guān)上去了（mac地址填寫的是網(wǎng)關(guān)的mac）。

從本機1.1.3.33 ping 11.239.161.60的過程，因為不是同一子網(wǎng)按照路由規(guī)則匹配，根據(jù)route表應該走1.1.15.254這個網(wǎng)關(guān)，如下截圖：

image

首先是目標IP 11.239.161.60 符合最上面紅框中的路由規(guī)則，又不是同一子網(wǎng)，所以查找路由規(guī)則中的網(wǎng)關(guān)1.1.15.254的Mac地址，arp cache中有，于是將 0c:da:41:6e:23:00 填入包頭，那么這個icmp request包就發(fā)到1.1.15.254上了，雖然包頭的mac是 0c:da:41:6e:23:00，但是IP還是 11.239.161.60。

看看目標IP 11.239.161.60 真正的mac信息（跟ping包包頭的Mac是不同的）：

image

這個包根據(jù)Mac地址路由到了網(wǎng)關(guān)上。

網(wǎng)關(guān)接下來怎么辦？

為了簡化問題，假設(shè)兩個網(wǎng)關(guān)直連

網(wǎng)關(guān)收到這個包后（因為mac地址是它的），打開一看IP地址是 11.239.161.60，不是自己的，于是繼續(xù)查自己的route和arp緩存，發(fā)現(xiàn)11.239.161.60這個IP的網(wǎng)關(guān)是11.239.163.247，于是把包的目的mac地址改成11.239.163.247的mac繼續(xù)發(fā)出去。

11.239.163.247這個網(wǎng)關(guān)收到包后，一看 11.239.161.60是自己同一子網(wǎng)的IP，于是該arp廣播找mac就廣播，cache有就拿cache的，然后這個包才最終到達目的11.239.161.60上。

整個過程中目標mac地址每一跳都在變，IP地址不變，每經(jīng)過一次MAC變化可以簡單理解成一跳。

實際上可能要經(jīng)過多個網(wǎng)關(guān)多次跳躍才能真正到達目標機器。

目標機器收到這個icmp包后的回復過程一樣，略過。

arp廣播風暴和arp欺騙

廣播風暴：如果一個子網(wǎng)非常大，機器非常多，每次arp查詢都是廣播的話，也容易因為N*N的問題導致廣播風暴。

arp欺騙：同樣如果一個子網(wǎng)中的某臺機器冒充網(wǎng)關(guān)或者其他機器，當收到arp廣播查詢的時候總是把自己的mac冒充目標機器的mac發(fā)給你，然后你的包先走到他，再轉(zhuǎn)發(fā)給真正的網(wǎng)關(guān)或者目標機器，所以在里面動點什么手腳，看看你發(fā)送的內(nèi)容都還是很容易的。

講完基礎(chǔ)知識再來看開篇問題的答案

讀完上面的基礎(chǔ)知識相信現(xiàn)在我們已經(jīng)能夠回答 ping IP 后發(fā)生了什么。這些已經(jīng)足夠解決99%的程序員日常網(wǎng)絡(luò)中網(wǎng)絡(luò)為什么不通的問題了。但是前面的問題比這個要稍微復雜一點，還是依靠這些基礎(chǔ)知識就能解決——這是基礎(chǔ)知識的威力。

現(xiàn)場網(wǎng)絡(luò)同學所做的一些其它測試：

懷疑不通的IP所使用的mac地址沖突，在交換機上清理了交換機的arp緩存，沒有幫助，還是不通；
新拿出一臺物理機配置上不通的容器的IP，這是通的，所以負責網(wǎng)絡(luò)的同學堅持是容器網(wǎng)絡(luò)的配置導致了問題。

對于1能通，我認為這個測試不嚴格，新物理機所用的mac不一樣，并且所接的交換機口也不一樣，影響了測試結(jié)果。

祭出萬能手段——抓包

抓包在網(wǎng)絡(luò)問題中是萬能的，但是第一次容易被tcpdump抓包命令的眾多參數(shù)嚇暈，不去操作你永遠上不了手，差距也就拉開了，你看差距有時候只是你對一條命令的執(zhí)行。

在物理機2上抓包：

[圖片上傳中...(image-1459f7-1562305883503-6)]

image

這個抓包能看到核心證據(jù)，ping包有到達物理機2，同時物理機2也正確回復了（mac、ip都對）。

同時在物理機1上抓包（抓包截圖略掉）只能看到ping包出去，回包沒有到物理機1（所以回包肯定不會回到容器里了）。

到這里問題的核心在交換機沒有正確地把物理機2的回包送到物理機1上面，同時觀察到的不正常延時都在網(wǎng)關(guān)那一跳：

image

最終的原因

最后在交換機上分析包沒正確發(fā)到物理機1上的原因跟客戶交換機使用了HSRP（熱備份路由器協(xié)議，就是多個交換機HA高可用，也就是同一子網(wǎng)可以有多個網(wǎng)關(guān)的IP），停掉HSRP后所有IP容器都能通了，并且前面的某些容器延時也恢復正常了。

通俗點說就是HSRP把回包拐跑了，有些回包拐跑了又送回來了（延時200ms那些）

至于HSRP為什么會這么做，要廠家出來解釋了。這里關(guān)鍵在于能讓客戶認同問題出現(xiàn)在交換機上還是前面的抓包證據(jù)充分，無可辯駁。實際中我們都習慣不給證據(jù)就說：我的程序沒問題，就是你的問題。這樣表述沒有一點意義，我們是要拿著證據(jù)這么說，對方也好就著證據(jù)來反駁，這叫優(yōu)雅地甩鍋。

網(wǎng)絡(luò)到底通不通是個復雜的問題嗎？

講這個過程的核心目的是除了真正的網(wǎng)絡(luò)不通，有些是服務不可用了也怪網(wǎng)絡(luò)。很多現(xiàn)場的同學根本講不清自己的服務（比如80端口上的tomcat服務）還在不在，網(wǎng)絡(luò)通不通，是網(wǎng)絡(luò)不通呢還是服務出了問題。一看到SocketTimeoutException 就想把網(wǎng)絡(luò)同學抓過來羞辱兩句：網(wǎng)絡(luò)不通了，網(wǎng)絡(luò)抖動導致我的程序異常了（網(wǎng)絡(luò)抖動是個萬能的扛包俠）。

實際這里涉及到四個節(jié)點（以兩個網(wǎng)關(guān)直連為例），srcIP -> src網(wǎng)關(guān) -> dest網(wǎng)關(guān) -> destIP。如果ping不通(也有特殊的防火墻限制ping包不讓過的），那么在這四段中分段ping（二分查找程序員應該最熟悉了）。比如前面的例子就是網(wǎng)關(guān)沒有把包轉(zhuǎn)發(fā)回來。

抓包看ping包有沒有出去，對方抓包看有沒有收到，收到后有沒有回復。

ping自己網(wǎng)關(guān)能不能通，ping對方網(wǎng)關(guān)能不能通。

接下來說點跟程序員日常相關(guān)的

如果網(wǎng)絡(luò)能ping通，服務無法訪問

那么嘗試telnet IP port 看看你的服務是否還在監(jiān)聽端口，在的話再看看服務進程是否能正常響應新的請求。有時候是進程死掉了，端口也沒人監(jiān)聽了；有時候是進程還在但是假死了，所以端口也不響應新的請求了，還有的是TCP連接隊列滿了不能響應新的連接。

如果端口還在也是正常的話，telnet應該是好的：

image

假如我故意換成一個不存在的端口，目標機器上的OS直接就拒絕了這個
連接（抓包的話一般是看到reset標識）：

image

一個SocketTimeoutException，程序員首先懷疑網(wǎng)絡(luò)丟包的Case

當時的反饋應用代碼拋SocketTimeoutException，懷疑網(wǎng)絡(luò)問題：

業(yè)務應用連接Server 偶爾會出現(xiàn)超時異常；
業(yè)務很多這樣的異常日志：[Server SocketTimeoutException]

檢查一下當時的網(wǎng)絡(luò)狀態(tài)非常好，出問題時間段的網(wǎng)卡的量信息也非常正常：

image

上圖是通過sar監(jiān)控到的9號 v24d9e0f23d40 這個網(wǎng)卡的流量，看起來也是正常，流量沒有出現(xiàn)明顯的波動。

為了監(jiān)控網(wǎng)絡(luò)到底有沒有問題，接著在出問題的兩個容器上各啟動一個http server，然后在對方每1秒鐘互相發(fā)一次發(fā)http get請求訪問這個http server，基本認識告訴我們?nèi)绻W(wǎng)絡(luò)丟包、卡頓嚴重，那么我這個http server的監(jiān)控日志時間戳也會跳躍，如果應用是因為網(wǎng)絡(luò)出現(xiàn)異常那么我啟動的http服務也會出現(xiàn)異常——寧愿寫個工具都不背鍋（主要是背了鍋也不一定能解決掉問題）。

從實際監(jiān)控來看，應用出現(xiàn)異常的時候我的http服務是正常的（寫了腳本判斷日志的連續(xù)性）：

image

這也強有力地證明了網(wǎng)絡(luò)沒問題，所以寫業(yè)務代碼的同學一門心思集中火力查看應用的問題。后來的實際調(diào)查發(fā)現(xiàn)是應用假死掉了（內(nèi)部線程太多，卡死了），服務端口不響應請求了。

如果基礎(chǔ)知識缺乏一點那么甩過來的這個鍋網(wǎng)絡(luò)是扛不動的，同時也阻礙了問題的真正發(fā)現(xiàn)。

TCP協(xié)議通訊過程跟前面ping一樣，只是把ping的icmp協(xié)議換成TCP協(xié)議，也是要先根據(jù)route，然后arp。

總結(jié)

網(wǎng)絡(luò)丟包、卡頓、抖動很容易做扛包俠，只有找到真正的原因解決問題才會更快，否則在錯誤的方向上怎么發(fā)力都不對。準確的方向要靠好的基礎(chǔ)知識和正確的邏輯以及證據(jù)來支撐，而不是猜測。

基礎(chǔ)知識是決定你能否干到退休的關(guān)鍵因素；
有了基礎(chǔ)知識不代表你能真正轉(zhuǎn)化成生產(chǎn)力；
越是基礎(chǔ)，越是幾十年不變的基礎(chǔ)越是重要；
知識到靈活運用要靠實踐，同時才能把知識之間的聯(lián)系建立起來；
簡而言之缺的是融會貫通和運用；
做一個有禮有節(jié)的甩包俠；
在別人不給證據(jù)愚昧甩包的情況下你的機會就來了。

留幾個小問題：

server回復client的時候是如何確定回復包中的src-ip和dest-mac的？一定是請求包中的dest-ip當成src-ip嗎？
上面問題中如果是TCP或者UDP協(xié)議，他們回復包中的src-ip和dest-mac獲取會不一樣嗎？
既然局域網(wǎng)中都是依賴Mac地址來定位，那么IP的作用又是什么呢？

參考資料：

[1]https://tools.ietf.org/html/rfc1180

[2]https://tools.ietf.org/html/rfc1180

《計算機基礎(chǔ)》

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

一個網(wǎng)絡(luò)包的旅程

一個網(wǎng)絡(luò)包的旅程

大學學到的基本概念