全世界幾十億臺電腦,連接在一起,兩兩通信。上海的某一塊網(wǎng)卡送出信號,洛杉磯的另一塊網(wǎng)卡居然就收到了,兩者實(shí)際上根本不知道對方的物理位置,你不覺得這是很神奇的事情嗎?
五層模型?;ヂ?lián)網(wǎng)的實(shí)現(xiàn),分成好幾層。每一層都有自己的功能,就像建筑物一樣,每一層都靠下一場支持。
用戶接觸到的,只是最上面的一層,根本沒有感覺到下面的層。要理解互聯(lián)網(wǎng),必須從最下層開始,自下而上理解每一層的功能。
如何分層有不同的模型,有的模型分七層,有的分四層。我覺得,把互聯(lián)網(wǎng)分層五層,比較容易解釋。
應(yīng)用層、傳輸層、網(wǎng)絡(luò)層、鏈接層、實(shí)體層。
她們叫什么名字,其實(shí)并不重要。只需要知道,互聯(lián)網(wǎng)分成若干層就可以了。
層與協(xié)議: 每一層都是為了完成一種功能。為了實(shí)現(xiàn)這些功能,就需要大家都遵守共同的規(guī)則(協(xié)議)。
1、實(shí)體層
:電腦要組網(wǎng),第一件事要干什么?當(dāng)然是先把電腦連起來,可以用光纜、電纜、雙絞線、無線電波等方式
這就叫做“實(shí)體層”,她就是把電腦連接起來的物理手段。她主要規(guī)定了網(wǎng)絡(luò)的一些電器特性,作用是負(fù)責(zé)傳送0和1的電信號。
2、鏈接層
: 單純的0和1沒有任何意義,必須規(guī)定解讀方式:多少個電信號算一組?每個信號位有何意義?
這就是“鏈接層”的功能,她在實(shí)體層的上方,確定了0和1的分組方式。
以太網(wǎng)協(xié)議
: 早期的時候,每家公司都有自己的電信號分組方式。逐漸的,一種叫做“以太網(wǎng)”(Ethernet)的協(xié)議,占據(jù)了主導(dǎo)地位。
以太網(wǎng)規(guī)定,一組電信號構(gòu)成一個數(shù)據(jù)包,叫做“幀”(Frame)。每一幀分成兩個部分:標(biāo)頭(head)和數(shù)據(jù)(data)
“標(biāo)頭”包含數(shù)據(jù)包的一些說明項(xiàng),比如發(fā)送者、接受者、數(shù)據(jù)類型等等,“數(shù)據(jù)”則是數(shù)據(jù)包的具體內(nèi)容。
“標(biāo)頭”的長度,固定為18字節(jié)?!皵?shù)據(jù)”的長度,最短為46字節(jié),最長為1500字節(jié)。因此,整個幀最短為64字節(jié),
最長為1518字節(jié)。如果數(shù)據(jù)很長,就必須分割成多個幀進(jìn)行發(fā)送。

MAC地址
上面提到,以太網(wǎng)數(shù)據(jù)包的標(biāo)頭,包含了發(fā)送者和接受者的信息。那么,發(fā)送者和接受者是如何標(biāo)識呢?
以太網(wǎng)規(guī)定,連入網(wǎng)絡(luò)的所有設(shè)備,都必須具有“網(wǎng)卡”接口。數(shù)據(jù)包必須是從一塊網(wǎng)卡,傳送到另一塊網(wǎng)卡。
網(wǎng)卡的地址,就是數(shù)據(jù)包的發(fā)送地址和接收地址,這叫做MAC地址。
每塊網(wǎng)卡出廠的時候,都有一個全世界獨(dú)一無二的MAC地址,長度是48個二進(jìn)制位,通常用12個十六進(jìn)制數(shù)
表示。

前6個十六進(jìn)制數(shù)是廠商編號,后6個是該廠商的網(wǎng)卡流水號。
有了MAC地址,就可以定位網(wǎng)卡和數(shù)據(jù)包的路徑了。
廣播
定義地址只是第一步,后面還有更多的步驟。
首先,一塊網(wǎng)卡怎么會知道另一塊網(wǎng)卡的MAC地址?
回答是有一種ARP(address resolution protocol地址解析協(xié)議)協(xié)議,可以解決這個問題。這個留到后面介紹,這里只需要知道,以太網(wǎng)數(shù)據(jù)包必須知道接收方的MAC地址,然后才能發(fā)送。
其次,就算有了MAC地址,系統(tǒng)怎樣才能把數(shù)據(jù)包準(zhǔn)確送到接收方?
回答是以太網(wǎng)采用了一種很“原始”的方式,她不是把數(shù)據(jù)包準(zhǔn)確的送到接收方,而是向本網(wǎng)絡(luò)內(nèi)所有計算機(jī)發(fā)送,讓每臺計算機(jī)自己判斷,是否為接收方。

上圖中,1號計算機(jī)向2號計算機(jī)發(fā)送一個數(shù)據(jù)包,同一個子網(wǎng)絡(luò)的3號、4號、5號計算機(jī)都會收到這個包。她們
讀取這個包的“標(biāo)頭”,找到接收方的MAC地址,然后與自身的MAC地址相比較,如果兩者相同,就接受這個包,
做進(jìn)一步處理,否則就丟棄這個包。這種發(fā)送方式就叫做“廣播”
有了數(shù)據(jù)包的定義、網(wǎng)卡的MAC地址、廣播的發(fā)送方式,“鏈接層”就可以在多臺計算機(jī)之間傳送數(shù)據(jù)了。
3、網(wǎng)絡(luò)層:
以太網(wǎng)協(xié)議,依靠MAC地址發(fā)送數(shù)據(jù)。理論上,單單依靠MAC地址,上海的網(wǎng)卡就可以找到洛杉磯的網(wǎng)卡了,技術(shù)上是可以實(shí)現(xiàn)的。(只要她們處于同一個“子”網(wǎng)絡(luò)“這是由物理層決定的”,接收方可以接收廣播。局域網(wǎng)吧?)
但是,這樣做有一個重大的缺點(diǎn)。以太網(wǎng)采用廣播方式發(fā)送數(shù)據(jù)包,所有成員人手一“包”,不僅效率低,而且局限在發(fā)送者所在的子網(wǎng)絡(luò)(局域網(wǎng)?局域網(wǎng)屬于子網(wǎng)絡(luò))。
也就是說,如果兩臺計算機(jī)不在同一個子網(wǎng)絡(luò),廣播是傳不過去的。這種設(shè)計是合理的,否則互聯(lián)網(wǎng)上每一臺計算機(jī)都會收到所有包(再分辨是不是發(fā)送給自己的),那會引起災(zāi)難。
互聯(lián)網(wǎng)是無數(shù)子網(wǎng)絡(luò)共同組成的一個巨型網(wǎng)絡(luò),很難想象上海和洛杉磯的電腦會在同一個子網(wǎng)絡(luò),這幾乎是不可能的。

因此,必須找到一種方法,能夠區(qū)分哪些MAC地址屬于同一個子網(wǎng)絡(luò),哪些不是。如果是同一個子網(wǎng)絡(luò),就采用
廣播方式發(fā)送,否則就采用“路由”方式發(fā)送。(路由的意思,就是指如何向不同的子網(wǎng)絡(luò)分發(fā)數(shù)據(jù)包,這是一個很大的主題,本文不涉及。)遺憾的是,MAC地址本身無法做到這一點(diǎn)。她只與廠商有關(guān),與所處網(wǎng)絡(luò)無關(guān)。
這就導(dǎo)致了“網(wǎng)絡(luò)層”的誕生。她的作用是引進(jìn)一套新的地址,使得我們能夠區(qū)分不同的計算機(jī)是否屬于同一個子網(wǎng)絡(luò)。這套地址就叫做“網(wǎng)絡(luò)地址”,簡稱“網(wǎng)址”。
于是,網(wǎng)絡(luò)層出現(xiàn)之后,每臺計算機(jī)有了兩種地址,一種是MAC地址,另一種是網(wǎng)絡(luò)地址。兩種地址之間沒有任何聯(lián)系,MAC地址是綁定在網(wǎng)卡上的,網(wǎng)絡(luò)地址則是管理員分配的,她們只是隨機(jī)組合在一起。
網(wǎng)絡(luò)地址幫助我們確定(計算機(jī)所在的)子網(wǎng)絡(luò),MAC地址則將數(shù)據(jù)包送到(該子網(wǎng)絡(luò)中的)目標(biāo)網(wǎng)卡。
因此,從邏輯上可以推斷,必定是先處理網(wǎng)絡(luò)地址,然后再處理MAC地址。
網(wǎng)絡(luò)層,之ip協(xié)議。
規(guī)定網(wǎng)絡(luò)地址的協(xié)議,叫做ip協(xié)議。她所定義的地址,就被稱為ip地址。
目前,廣泛采用的是ip協(xié)議第四版,簡稱ipv4.這個版本規(guī)定,網(wǎng)絡(luò)地址由32個二進(jìn)制位組成。

習(xí)慣上,我們用分成四段的十進(jìn)制數(shù)表示ip地址,從0.0.0.0一直到255.255.255.255。
互聯(lián)網(wǎng)上的每一臺計算機(jī),都會分配到一個ip地址。這個地址分成兩個部分,前一部分代表網(wǎng)絡(luò),后一部分代表主機(jī)。比如,ip地址172.16.254.1,這是一個32位的地址,假定她的網(wǎng)絡(luò)部分是前24位(172.16.254),那么主機(jī)部分就是后8位(最后那個1)。
處于同一個子網(wǎng)絡(luò)的電腦,她們ip地址的網(wǎng)絡(luò)部分必定是相同的。
也就是說172.16.254.2應(yīng)該與172.16.254.1處在同一個子網(wǎng)絡(luò)。
但是,問題在于單單從ip地址,我們無法判斷網(wǎng)絡(luò)部分。還是以172.16.254.1為例,她的網(wǎng)絡(luò)部分,到底是前24位,還是前16位,甚至前28位,從ip地址上是看不出來的。
那么,怎樣才能從ip地址,判斷兩臺計算機(jī)是否屬于同一個子網(wǎng)絡(luò)呢?這就要用到另一個參數(shù)“子網(wǎng)掩碼”(subnet mask)
所謂子網(wǎng)掩碼,就是表示子網(wǎng)特征的一個參數(shù)。她在形式上等同于ip地址,也是一個32位二進(jìn)制數(shù)字,她的網(wǎng)絡(luò)
部分全部為1,主機(jī)部分全部為0.比如,ip地址172.16.254.1,如果已知網(wǎng)絡(luò)部分是前24位,主機(jī)部分是后8位,
那么子網(wǎng)掩碼就是1111 1111.1111 1111.1111 1111.0000 0000,寫成十進(jìn)制就是255.255.255.0.
知道子網(wǎng)掩碼,我們就能判斷,任意兩個ip地址是否處在同一個子網(wǎng)絡(luò)。方法是將兩個ip地址與子網(wǎng)掩碼分別進(jìn)行
AND運(yùn)算(兩個數(shù)位都為1,運(yùn)算結(jié)果為1,否則為0),然后比較結(jié)果是否相同,如果是的話,就表面她們在同一個子網(wǎng)絡(luò)中,否則就不是。
比如,已知IP地址172.16.254.1和172.16.254.233的子網(wǎng)掩碼都是255.255.255.0,請問它們是否在同一個子網(wǎng)絡(luò)?兩者與子網(wǎng)掩碼分別進(jìn)行AND運(yùn)算,結(jié)果都是172.16.254.0,因此它們在同一個子網(wǎng)絡(luò)。
總結(jié)一下,ip協(xié)議的作用主要有兩個,
一個是為每一臺計算機(jī)分配ip地址。
另一個是確定哪些地址在同一個子網(wǎng)絡(luò)。
網(wǎng)絡(luò)層,之ip數(shù)據(jù)包。
根據(jù)ip協(xié)議發(fā)送的數(shù)據(jù),就叫做ip數(shù)據(jù)包。不難想象,其中必定包括ip地址信息。
但是前面說過,以太網(wǎng)數(shù)據(jù)包只包含MAC地址,并沒有ip地址的欄位。那么是否需要修改數(shù)據(jù)定義,再添加一個欄位呢?
回答是不需要,我們可以把ip數(shù)據(jù)包直接放進(jìn)以太網(wǎng)數(shù)據(jù)包的“數(shù)據(jù)”部分,因此完全不用修改以太網(wǎng)的規(guī)格。這就是互聯(lián)網(wǎng)分層結(jié)構(gòu)的好處:上層的變動完全不涉及下層的結(jié)構(gòu)。
具體來說,ip數(shù)據(jù)包也分為“標(biāo)頭”和“數(shù)據(jù)”兩個部分。

"標(biāo)頭"部分主要包括版本、長度、ip地址等信息,“數(shù)據(jù)”部分則是ip數(shù)據(jù)包的具體內(nèi)容。
她放進(jìn)以太網(wǎng)數(shù)據(jù)包后,以太網(wǎng)數(shù)據(jù)包變成了下面這樣。

ip數(shù)據(jù)包的“標(biāo)頭”部分的長度為20到60字節(jié),整個數(shù)據(jù)包的總長度最大為65535字節(jié)。因此,理論上,一個ip數(shù)據(jù)包的“數(shù)據(jù)”部分,最長為65535-20=65515字節(jié)。前面說過,以太網(wǎng)數(shù)據(jù)包的“數(shù)據(jù)”部分,最長只有1500字節(jié)。
因此,如果ip數(shù)據(jù)包超過了1500字節(jié),她就需要分割成幾個以太網(wǎng)數(shù)據(jù)包,分開發(fā)送了。
網(wǎng)絡(luò)層,之ARP協(xié)議。
因?yàn)閕p數(shù)據(jù)包是放在以太網(wǎng)數(shù)據(jù)包里發(fā)送的,所以我們必須同時知道兩個地址,一個是對方的MAC地址,另一個是對方的ip地址。通常情況下,對方的ip地址是已知的(后文會解釋),但是我們不知道她的MAC地址。
所以,我們需要一種機(jī)制,能夠從ip地址得到MAC地址。
這里又可以分成兩種情況。
1、如果兩臺主機(jī)不在同一個子網(wǎng)絡(luò),那么事實(shí)上沒有辦法得到對方的MAC地址,只能把數(shù)據(jù)包傳送到兩個子網(wǎng)絡(luò)連接處的“網(wǎng)關(guān)”(gateway),讓網(wǎng)關(guān)去處理。
2、如果兩臺主機(jī)在同一個子網(wǎng)絡(luò),那么我們可以用ARP協(xié)議,得到對方的MAC地址。ARP協(xié)議也是發(fā)出一個數(shù)據(jù)包(包含在以太網(wǎng)數(shù)據(jù)包中),其中包含她所要查詢主機(jī)的ip地址,在對方的MAC地址這一欄,填的是FF:FF:FF:FF:FF:FF,表示這是一個“廣播”地址。她所在子網(wǎng)絡(luò)的每一臺主機(jī),都會收到這個數(shù)據(jù)包,與自身的ip地址進(jìn)行比較。如果兩者相同,就做出回復(fù),向?qū)Ψ桨l(fā)報告自己的MAC地址,否則就丟棄這個包。
總之,有了ARP協(xié)議之后,我們就可以得到同一個子網(wǎng)絡(luò)的主機(jī)MAC地址,可以把數(shù)據(jù)包發(fā)送到任意一臺主機(jī)之上了。
4、傳輸層
有了MAC地址和ip地址,我們已經(jīng)可以在互聯(lián)網(wǎng)上任意兩臺主機(jī)上建立通信。
接下來的問題是,同一臺主機(jī)上有許多程序都需要用到網(wǎng)絡(luò),比如,你一邊瀏覽網(wǎng)頁,一邊與朋友在線聊天。當(dāng)一個數(shù)據(jù)包從互聯(lián)網(wǎng)上發(fā)來的時候,你怎么知道,她是表示網(wǎng)頁的內(nèi)容,還是表示在線聊天的內(nèi)容?
也就是說,我們還需要一個參數(shù),表示這個數(shù)據(jù)包到底供哪個程序(進(jìn)程)使用。這個參數(shù)就叫做端口(port),她其實(shí)是每一個使用網(wǎng)卡的程序的編號。每個數(shù)據(jù)包都發(fā)到主機(jī)的特定端口,所以不同的程序就能取到自己所需要
的數(shù)據(jù)。
端口是0到65535之間的一個整數(shù),正好16個二進(jìn)制位。0到1023的端口被系統(tǒng)占用,用戶只能選用大于1023的端口。不管是瀏覽網(wǎng)頁還是在線聊天,應(yīng)用程序會隨機(jī)選用一個端口,然后與服務(wù)器的相應(yīng)端口聯(lián)系。
傳輸層的功能,就是建立“端口到端口”的通信。相比之下,網(wǎng)絡(luò)層的功能是建立“主機(jī)到主機(jī)”的通信。只要確定主機(jī)和端口,我們就能實(shí)現(xiàn)程序之間的交流。因此,Unix系統(tǒng)就把主機(jī)+端口,叫做“套接字socket”。有了她,就可以進(jìn)行網(wǎng)絡(luò)應(yīng)用程序的開發(fā)了。
傳輸層,之UDP協(xié)議。
現(xiàn)在,我們必須在數(shù)據(jù)包中加入端口信息,這就需要新的協(xié)議。最簡單的實(shí)現(xiàn)叫做UDP協(xié)議,她的格式幾乎就是在數(shù)據(jù)前面,加上端口號。
UDP數(shù)據(jù)包,也是有“標(biāo)頭”和“數(shù)據(jù)”兩部分組成

標(biāo)頭部分主要定義了發(fā)出端口和接收端口,數(shù)據(jù)部分就是具體的內(nèi)容。然后,把整個UDP數(shù)據(jù)包放入ip數(shù)據(jù)包的數(shù)據(jù)部分,而前面說過,ip數(shù)據(jù)包又是放在以太網(wǎng)數(shù)據(jù)包之中的,所以整個以太網(wǎng)數(shù)據(jù)包現(xiàn)在變成了下面這樣:

UDP協(xié)議數(shù)據(jù)包非常簡單,“標(biāo)頭”部分一共只有8個字節(jié),總長度不超過65535字節(jié),正好放進(jìn)一個ip數(shù)據(jù)包。
傳輸層,之TCP協(xié)議。
UDP協(xié)議的優(yōu)點(diǎn)是比較簡單,容易實(shí)現(xiàn),但是缺點(diǎn)是可靠性較差,一旦數(shù)據(jù)包發(fā)出,無法知道對方是否收到。
為了解決這個問題,提高網(wǎng)絡(luò)可靠性,TCP協(xié)議就誕生了。這個協(xié)議非常復(fù)雜,但可以近似人為,她就是有確認(rèn)機(jī)制的UDP協(xié)議,每發(fā)出一個數(shù)據(jù)包都要求確認(rèn)。如果有一個數(shù)據(jù)包遺失,就收不到確認(rèn),發(fā)出方就知道有必要重發(fā)這個數(shù)據(jù)包了。
因此,TCP協(xié)議能夠確保數(shù)據(jù)不會遺失。她的缺點(diǎn)是過程復(fù)雜、實(shí)現(xiàn)困難、消耗較多的資源。
TCP數(shù)據(jù)包和UDP數(shù)據(jù)包一樣,都是內(nèi)嵌在ip數(shù)據(jù)包的數(shù)據(jù)部分。TCP數(shù)據(jù)包沒有長度限制,理論上可以無限長,但是為了保證網(wǎng)絡(luò)的效率,通常TCP數(shù)據(jù)包的長度不會超過ip數(shù)據(jù)包的長度,以確保單個TCP數(shù)據(jù)包不必再分割。
5、應(yīng)用層
http協(xié)議
應(yīng)用程序收到“傳輸層”的數(shù)據(jù),接下來就要進(jìn)行解讀。由于互聯(lián)網(wǎng)是開放架構(gòu),數(shù)據(jù)來源五花八門,必須事先規(guī)定好格式,否則根本無法解讀。
應(yīng)用層的作用,就是規(guī)定應(yīng)用程序的數(shù)據(jù)格式。
舉例來說,TCP協(xié)議可以為各種各樣的程序傳遞數(shù)據(jù),比如Email、WWW、FTP等等。那么,必須有不同協(xié)議規(guī)定電子郵件、網(wǎng)頁、FTP數(shù)據(jù)的格式,這些應(yīng)用程序協(xié)議就構(gòu)成了“應(yīng)用層”。
這是最高的一層,直接面對用戶。她的數(shù)據(jù)就放在TCP數(shù)據(jù)包的“數(shù)據(jù)”部分。因此,現(xiàn)在的以太網(wǎng)的數(shù)據(jù)包就變成下面這樣。

至此,整個互聯(lián)網(wǎng)的五層結(jié)構(gòu),自下而上全部講完了。這是從系統(tǒng)的角度,解釋互聯(lián)網(wǎng)是如何構(gòu)成的。