最近面試總被問到網(wǎng)絡(luò)的知識,在這里把我覺得要記錄的總結(jié)下來。
TCP/UDP
首先 網(wǎng)絡(luò)層次模型圖如下

TCP/UDP協(xié)議是傳輸層協(xié)議,主要解決數(shù)據(jù)如何在網(wǎng)絡(luò)中傳輸,而http是應(yīng)用層協(xié)議,主要解決如何包裝數(shù)據(jù).
TCP/UDP的區(qū)別:
- TCP面向連接(如打電話要先撥號建立連接);UDP是無連接的,即發(fā)送數(shù)據(jù)之前不需要建立連接
- TCP提供可靠的服務(wù)。也就是說,通過TCP連接傳送的數(shù)據(jù),無差錯,不丟失,不重復(fù),且按序到達(dá);UDP盡最大努力交付,即不保證可靠交付
- TCP面向字節(jié)流,實際上是TCP把數(shù)據(jù)看成一連串無結(jié)構(gòu)的字節(jié)流;UDP是面向報文的
UDP沒有擁塞控制,因此網(wǎng)絡(luò)出現(xiàn)擁塞不會使源主機(jī)的發(fā)送速率降低(對實時應(yīng)用很有用,如IP電話,實時視頻會議等) - 每一條TCP連接只能是點(diǎn)到點(diǎn)的;UDP支持一對一,一對多,多對一和多對多的交互通信
- TCP首部開銷20字節(jié);UDP的首部開銷小,只有8個字節(jié)
- TCP的邏輯通信信道是全雙工的可靠信道,UDP則是不可靠信道
TCP的優(yōu)點(diǎn)與缺點(diǎn)
- 優(yōu)點(diǎn):可靠,穩(wěn)定 (三次握手)而且在數(shù)據(jù)傳遞時有確認(rèn)、窗口、重傳、擁塞控制機(jī)制,數(shù)據(jù)傳完后斷開連接節(jié)約系統(tǒng)資源
- 缺點(diǎn):慢、效率低、占用系統(tǒng)資源比較高,容易被攻擊 tcp在連接之前,要先建立連接,這會消耗時間,而且在數(shù)據(jù)傳遞時,確認(rèn)機(jī)制、重傳機(jī)制、擁塞控制機(jī)制都會消耗大量的時間 ,而且每臺計算機(jī)上維護(hù)所有的連接,都會占用大量的系統(tǒng)的cpu 內(nèi)存等硬件資源。
UDP的優(yōu)點(diǎn)與缺點(diǎn)
- 優(yōu)點(diǎn):快,相對安全 UDP 是一個無狀態(tài)的傳輸協(xié)議,所以傳輸速度非常快
- 缺點(diǎn):不可靠 不穩(wěn)定
TCP 數(shù)據(jù)包格式

TCP數(shù)據(jù)包可分為TCP包頭和來自應(yīng)用層的數(shù)據(jù)兩部分TCP段格式
中間的標(biāo)志位就是用于協(xié)議的一些機(jī)制的實現(xiàn)的比特位大家可以看到有6比特,它們依次如下: URG、ACK、PSH、RST、SYN、FIN。
URG表示緊急指針字段有效;
ACK置位表示確認(rèn)號字段有效;
PSH表示當(dāng)前報文需要請求推(push)操作;
RST置位表示復(fù)位TCP連接;
SYN用于建立TCP連接時同步序號;
FIN用于釋放TCP連接時標(biāo)識發(fā)送方比特流結(jié)束。
源端口和目的端口:各為16比特,用于表示應(yīng)用層的連接。源端口表示產(chǎn)生數(shù)據(jù)包的應(yīng)用層進(jìn)程,而目的端口則表示數(shù)據(jù)包所要到達(dá)的目的進(jìn)程。
序列號:為32比特,表示數(shù)據(jù)流中的字節(jié)數(shù)。序列號為首字節(jié)在整個數(shù)據(jù)流中的位置。初始序列號隨機(jī)產(chǎn)生,并在連接建立階段予以同步。
確認(rèn)號:表示序號為確認(rèn)號減去1的數(shù)據(jù)包及其以前的所有數(shù)據(jù)包已經(jīng)正確接收,也就是說他相當(dāng)于下一個準(zhǔn)備接收的字節(jié)的序號。
頭部信息:4比特,用于指示數(shù)據(jù)起始位置。由于TCP包頭中可選項的長度可變,因此整個包頭的長度不固定。如果沒有附加字段,則TCP數(shù)據(jù)包基本長度為20字節(jié)。
窗口:16位,表示源端主機(jī)在請求接收端等待確認(rèn)之前需要接收的字節(jié)數(shù)。它用于流量控制,窗口大小根據(jù)網(wǎng)絡(luò)擁塞情況和資源可用性進(jìn)行增減。
校驗位:16位。用于檢查TCP數(shù)據(jù)包頭和數(shù)據(jù)的一致性。
緊急指針:16位。當(dāng)URG碼有效時只向緊急數(shù)據(jù)字節(jié)。
可選項:存在時表示TCP包頭后還有另外的4字節(jié)數(shù)據(jù)。TCP常用的選項為最大數(shù)據(jù)包(并非整個TCP報文)MSS。每一個TCP段都包含一個固定的20字節(jié)的段頭。TCP段頭由20字節(jié)固定頭和一些可選項組成。實際數(shù)據(jù)部分最多可以有65495(65535-20-20=65495)字節(jié)。
UDP數(shù)據(jù)包格式
UDP協(xié)議分為首部字段和數(shù)據(jù)字段,其中首部字段只占用8個字節(jié),分別是個占用兩個字節(jié)的源端口、目的端口、長度和檢驗和。
長度:UDP報文的整個大小,最小為8個字節(jié)(僅為首部)。
檢驗和:在進(jìn)行檢驗和計算時,會添加一個偽首部一起進(jìn)行運(yùn)算。偽首部(占用12個字節(jié))為:4個字節(jié)的源IP地址、4個字節(jié)的目的IP地址、1個字節(jié)的0、一個字節(jié)的數(shù)字17、以及占用2個字節(jié)UDP長度。這個偽首部不是報文的真正首部,只是引入為了計算校驗和。相對于IP協(xié)議的只計算首部,UDP檢驗和會把首部和數(shù)據(jù)一起進(jìn)行校驗。接收端進(jìn)行的校驗和與UDP報文中的校驗和相與,如果無差錯應(yīng)該全為1。如果有誤,則將報文丟棄或者發(fā)給應(yīng)用層、并附上差錯警告。
TCP連接
連接時:三次握手
首先Client端發(fā)送連接請求報文,Server段接受連接后回復(fù)ACK報文,并為這次連接分配資源。Client端接收到ACK報文后也向Server段發(fā)生ACK報文,并分配資源,這樣TCP連接就建立了。
斷開時:四次握手

為什么需要“三次握手”
在謝希仁著《計算機(jī)網(wǎng)絡(luò)》第四版中講“三次握手”的目的是“為了防止已失效的連接請求報文段突然又傳送到了服務(wù)端,因而產(chǎn)生錯誤”。在另一部經(jīng)典的《計算機(jī)網(wǎng)絡(luò)》一書中講“三次握手”的目的是為了解決“網(wǎng)絡(luò)中存在延遲的重復(fù)分組”的問題。這兩種不用的表述其實闡明的是同一個問題。 謝希仁版《計算機(jī)網(wǎng)絡(luò)》中的例子是這樣的,“已失效的連接請求報文段”的產(chǎn)生在這樣一種情況下:client發(fā)出的第一個連接請求報文段并沒有丟失,而是在某個網(wǎng)絡(luò)結(jié)點(diǎn)長時間的滯留了,以致延誤到連接釋放以后的某個時間才到達(dá)server。本來這是一個早已失效的報文段。但server收到此失效的連接請求報文段后,就誤認(rèn)為是client再次發(fā)出的一個新的連接請求。于是就向client發(fā)出確認(rèn)報文段,同意建立連接。假設(shè)不采用“三次握手”,那么只要server發(fā)出確認(rèn),新的連接就建立了。由于現(xiàn)在client并沒有發(fā)出建立連接的請求,因此不會理睬server的確認(rèn),也不會向server發(fā)送數(shù)據(jù)。但server卻以為新的運(yùn)輸連接已經(jīng)建立,并一直等待client發(fā)來數(shù)據(jù)。這樣,server的很多資源就白白浪費(fèi)掉了。采用“三次握手”的辦法可以防止上述現(xiàn)象發(fā)生。例如剛才那種情況,client不會向server的確認(rèn)發(fā)出確認(rèn)。server由于收不到確認(rèn),就知道client并沒有要求建立連接?!?。主要目的防止server端一直等待,浪費(fèi)資源。
為什么需要“四次揮手” 那可能有人會有疑問,在tcp連接握手時為何ACK是和SYN一起發(fā)送,這里ACK卻沒有和FIN一起發(fā)送呢。原因是因為tcp是全雙工模式,接收到FIN時意味將沒有數(shù)據(jù)再發(fā)來,但是還是可以繼續(xù)發(fā)送數(shù)據(jù)。
HTTP 簡介
HTTP 協(xié)議時一個基于TCP/IP通信協(xié)議來傳遞數(shù)據(jù)的。
主要特點(diǎn)
- 簡單快捷:客戶端向服務(wù)器端請求服務(wù)時,只需要給出請求方法與路徑。請求方法常用的 有GET、HEAD、POST。
- 靈活:HTTP 允許傳輸任意類型的數(shù)據(jù)對象。正在傳輸?shù)念愋陀蒀ontent-Type加以標(biāo)記。
- 無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)器處理完客戶的請求,并收到客戶的應(yīng)答后,即斷開連接。采用這種方式可以節(jié)省傳輸時間。
- 無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面,在服務(wù)器不需要先前信息時它的應(yīng)答就較快。
支持B/S及C/S模式。
HTTP 請求消息Request
客戶端發(fā)送一個http請求到服務(wù)器的請求消息包括以下格式
請求行(request line)、請求頭部(header)、空行和請求數(shù)據(jù) 四個組成部分

請求行以一個方法符號開頭,以空格分開,后面跟著請求的URI和協(xié)議的版本
Get請求例子,使用Charles抓取的request:
GET /562f25980001b1b106000338.jpg HTTP/1.1
Host img.mukewang.com
User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/,/*;q=0.8
Referer http://www.imooc.com/
Accept-Encoding gzip, deflate, sdch
Accept-Language zh-CN,zh;q=0.8
第一部分:請求行,用來說明請求類型,要訪問的資源以及所使用的HTTP版本.
GET說明請求類型為GET,[/562f25980001b1b106000338.jpg]為要訪問的資源,該行的最后一部分說明使用的是HTTP1.1版本。
第二部分:請求頭部,緊接著請求行(即第一行)之后的部分,用來說明服務(wù)器要使用的附加信息
從第二行起為請求頭部,HOST將指出請求的目的地.User-Agent,服務(wù)器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎(chǔ).該信息由你的瀏覽器來定義,并且在每個請求中自動發(fā)送等等
第三部分:空行,請求頭部后面的空行是必須的
即使第四部分的請求數(shù)據(jù)為空,也必須有空行。
第四部分:請求數(shù)據(jù)也叫主體,可以添加任意的其他數(shù)據(jù)。
這個例子的請求數(shù)據(jù)為空。
POST請求例子,使用Charles抓取的request:
>```
POST / HTTP1.1
Host:www.wrox.com
User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
Content-Type:application/x-www-form-urlencoded
Content-Length:40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
第一部分:請求行,第一行明了是post請求,以及http1.1版本。
第二部分:請求頭部,第二行至第六行。
第三部分:空行,第七行的空行。
第四部分:請求數(shù)據(jù),第八行。
HTTP之響應(yīng)消息Response
一般情況下,服務(wù)器接收并處理客戶端發(fā)過來的請求后會返回一個HTTP的響應(yīng)消息。
HTTP響應(yīng)也由四個部分組成,分別是:狀態(tài)行、消息報頭、空行和響應(yīng)正文。

HTTP/1.1 200 OK
Date: Fri, 22 May 2009 06:07:21 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head></head>
<body>
</body>
</html>
第一部分:狀態(tài)行,由HTTP協(xié)議版本號, 狀態(tài)碼, 狀態(tài)消息 三部分組成。
第一行為狀態(tài)行,(HTTP/1.1)表明HTTP版本為1.1版本,狀態(tài)碼為200,狀態(tài)消息為(ok)
第二部分:消息報頭,用來說明客戶端要使用的一些附加信息
第二行和第三行為消息報頭,
Date:生成響應(yīng)的日期和時間;Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8
第三部分:空行,消息報頭后面的空行是必須的
第四部分:響應(yīng)正文,服務(wù)器返回給客戶端的文本信息。
空行后面的html部分為響應(yīng)正文。
HTTP之狀態(tài)碼
狀態(tài)代碼有三位數(shù)字組成,第一個數(shù)字定義了響應(yīng)的類別,共分五種類別:
>1xx:指示信息--表示請求已接收,繼續(xù)處理
2xx:成功--表示請求已被成功接收、理解、接受
3xx:重定向--要完成請求必須進(jìn)行更進(jìn)一步的操作
4xx:客戶端錯誤--請求有語法錯誤或請求無法實現(xiàn)
5xx:服務(wù)器端錯誤--服務(wù)器未能實現(xiàn)合法的請求
常見狀態(tài)碼:
>200 OK //客戶端請求成功
400 Bad Request //客戶端請求有語法錯誤,不能被服務(wù)器所理解
401 Unauthorized //請求未經(jīng)授權(quán),這個狀態(tài)代碼必須和WWW-Authenticate報頭域一起使用
403 Forbidden //服務(wù)器收到請求,但是拒絕提供服務(wù)
404 Not Found //請求資源不存在,eg:輸入了錯誤的URL
500 Internal Server Error //服務(wù)器發(fā)生不可預(yù)期的錯誤
503 Server Unavailable //服務(wù)器當(dāng)前不能處理客戶端的請求,一段時間后可能恢復(fù)正常
HTTP請求方法
根據(jù)HTTP標(biāo)準(zhǔn),HTTP請求可以使用多種請求方法。
HTTP1.0定義了三種請求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五種請求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
>GET 請求指定的頁面信息,并返回實體主體。
HEAD 類似于get請求,只不過返回的響應(yīng)中沒有具體的內(nèi)容,用于獲取報頭
POST 向指定資源提交數(shù)據(jù)進(jìn)行處理請求(例如提交表單或者上傳文件)。數(shù)據(jù)被包含在請求體中。POST請求可能會導(dǎo)致新的資源的建立和/或已有資源的修改。
PUT 從客戶端向服務(wù)器傳送的數(shù)據(jù)取代指定的文檔的內(nèi)容。
DELETE 請求服務(wù)器刪除指定的頁面。
CONNECT HTTP/1.1協(xié)議中預(yù)留給能夠?qū)⑦B接改為管道方式的代理服務(wù)器。
OPTIONS 允許客戶端查看服務(wù)器的性能。
TRACE 回顯服務(wù)器收到的請求,主要用于測試或診斷。
HTTP工作原理
HTTP協(xié)議定義Web客戶端如何從Web服務(wù)器請求Web頁面,以及服務(wù)器如何把Web頁面?zhèn)魉徒o客戶端。HTTP協(xié)議采用了請求/響應(yīng)模型。客戶端向服務(wù)器發(fā)送一個請求報文,請求報文包含請求的方法、URL、協(xié)議版本、請求頭部和請求數(shù)據(jù)。服務(wù)器以一個狀態(tài)行作為響應(yīng),響應(yīng)的內(nèi)容包括協(xié)議的版本、成功或者錯誤代碼、服務(wù)器信息、響應(yīng)頭部和響應(yīng)數(shù)據(jù)。
以下是 HTTP 請求/響應(yīng)的步驟:
>1、客戶端連接到Web服務(wù)器
一個HTTP客戶端,通常是瀏覽器,與Web服務(wù)器的HTTP端口(默認(rèn)為80)建立一個TCP套接字連接。例如,http://www.oakcms.cn。
2、發(fā)送HTTP請求
通過TCP套接字,客戶端向Web服務(wù)器發(fā)送一個文本的請求報文,一個請求報文由請求行、請求頭部、空行和請求數(shù)據(jù)4部分組成。
3、服務(wù)器接受請求并返回HTTP響應(yīng)
Web服務(wù)器解析請求,定位請求資源。服務(wù)器將資源復(fù)本寫到TCP套接字,由客戶端讀取。一個響應(yīng)由狀態(tài)行、響應(yīng)頭部、空行和響應(yīng)數(shù)據(jù)4部分組成。
4、釋放連接TCP連接
若connection 模式為close,則服務(wù)器主動關(guān)閉TCP連接,客戶端被動關(guān)閉連接,釋放TCP連接;若connection 模式為keepalive,則該連接會保持一段時間,在該時間內(nèi)可以繼續(xù)接收請求;
5、客戶端瀏覽器解析HTML內(nèi)容
客戶端瀏覽器首先解析狀態(tài)行,查看表明請求是否成功的狀態(tài)代碼。然后解析每一個響應(yīng)頭,響應(yīng)頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集??蛻舳藶g覽器讀取響應(yīng)數(shù)據(jù)HTML,根據(jù)HTML的語法對其進(jìn)行格式化,并在瀏覽器窗口中顯示。
>例如:在瀏覽器地址欄鍵入URL,按下回車之后會經(jīng)歷以下流程:
1、瀏覽器向 DNS 服務(wù)器請求解析該 URL 中的域名所對應(yīng)的 IP 地址;
2、解析出 IP 地址后,根據(jù)該 IP 地址和默認(rèn)端口 80,和服務(wù)器建立TCP連接;
3、瀏覽器發(fā)出讀取文件(URL 中域名后面部分對應(yīng)的文件)的HTTP 請求,該請求報文作為 TCP 三次握手的第三個報文的數(shù)據(jù)發(fā)送給服務(wù)器;
4、服務(wù)器對瀏覽器請求作出響應(yīng),并把對應(yīng)的 html 文本發(fā)送給瀏覽器;
5、釋放 TCP連接;
6、瀏覽器將該 html 文本并顯示內(nèi)容;
GET和POST請求的區(qū)別
>GET請求
GET /books/?sex=man&name=Professional HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
注意最后一行是空行
>POST請求
POST / HTTP/1.1
Host: www.wrox.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Content-Type: application/x-www-form-urlencoded
Content-Length: 40
Connection: Keep-Alive
name=Professional%20Ajax&publisher=Wiley
1、GET提交,請求的數(shù)據(jù)會附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭中),以?分割URL和傳輸數(shù)據(jù),多個參數(shù)用&連接;例 如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果數(shù)據(jù)是英文字母/數(shù)字,原樣發(fā)送,如果是空格,轉(zhuǎn)換為+,如果是中文/其他字符,則直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號以16進(jìn)制表示的ASCII。
POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體中。上文示例中紅色字體標(biāo)明的就是實際的傳輸數(shù)據(jù)
因此,GET提交的數(shù)據(jù)會在地址欄中顯示出來,而POST提交,地址欄不會改變
2、傳輸數(shù)據(jù)的大小:首先聲明:HTTP協(xié)議沒有對傳輸?shù)臄?shù)據(jù)大小進(jìn)行限制,HTTP協(xié)議規(guī)范也沒有對URL長度進(jìn)行限制。
而在實際開發(fā)中存在的限制主要有:
GET:特定瀏覽器和服務(wù)器對URL長度有限制,例如 IE對URL長度的限制是2083字節(jié)(2K+35)。對于其他瀏覽器,如Netscape、FireFox等,理論上沒有長度限制,其限制取決于操作系 統(tǒng)的支持。
因此對于GET提交時,傳輸數(shù)據(jù)就會受到URL長度的 限制。
POST:由于不是通過URL傳值,理論上數(shù)據(jù)不受 限。但實際各個WEB服務(wù)器會規(guī)定對post提交數(shù)據(jù)大小進(jìn)行限制,Apache、IIS6都有各自的配置。
3、安全性
POST的安全性要比GET的安全性高。比如:通過GET提交數(shù)據(jù),用戶名和密碼將明文出現(xiàn)在URL上,因為(1)登錄頁面有可能被瀏覽器緩存;(2)其他人查看瀏覽器的歷史紀(jì)錄,那么別人就可以拿到你的賬號和密碼了,除此之外,使用GET提交數(shù)據(jù)還可能會造成Cross-site request forgery攻擊
4、Http get,post,soap協(xié)議都是在http上運(yùn)行的
(1)get:請求參數(shù)是作為一個key/value對的序列(查詢字符串)附加到URL上的
查詢字符串的長度受到web瀏覽器和web服務(wù)器的限制(如IE最多支持2048個字符),不適合傳輸大型數(shù)據(jù)集同時,它很不安全
(2)post:請求參數(shù)是在http標(biāo)題的一個不同部分(名為entity body)傳輸?shù)?,這一部分用來傳輸表單信息,因此必須將Content-type設(shè)置為:application/x-www-form- urlencoded。post設(shè)計用來支持web窗體上的用戶字段,其參數(shù)也是作為key/value對傳輸。
但是:它不支持復(fù)雜數(shù)據(jù)類型,因為post沒有定義傳輸數(shù)據(jù)結(jié)構(gòu)的語義和規(guī)則。
(3)soap:是http post的一個專用版本,遵循一種特殊的xml消息格式
Content-type設(shè)置為: text/xml 任何數(shù)據(jù)都可以xml化。
Http協(xié)議定義了很多與服務(wù)器交互的方法,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用于描述一個網(wǎng)絡(luò)上的資源,而HTTP中的GET, POST, PUT, DELETE就對應(yīng)著對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息,而POST一般用于更新資源信息.
我們看看GET和POST的區(qū)別
GET提交的數(shù)據(jù)會放在URL之后,以?分割URL和傳輸數(shù)據(jù),參數(shù)之間以&相連,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中.
GET提交的數(shù)據(jù)大小有限制(因為瀏覽器對URL的長度有限制),而POST方法提交的數(shù)據(jù)沒有限制.
GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值。
GET方式提交數(shù)據(jù),會帶來安全問題,比如一個登錄頁面,通過GET方式提交數(shù)據(jù)時,用戶名和密碼將出現(xiàn)在URL上,如果頁面可以被緩存或者其他人可以訪問這臺機(jī)器,就可以從歷史記錄獲得該用戶的賬號和密碼.