要寫網(wǎng)絡(luò)程序就必須用Socket,這是程序員都知道的。而且,面試的時(shí)候,我們也會(huì)問對方會(huì)不會(huì)Socket編程?一般來說,很多人都會(huì)說,Socket編程基本就是listen,accept以及send,write等幾個(gè)基本的操作。是的,就跟常見的文件操作一樣,只要寫過就一定知道。
對于網(wǎng)絡(luò)編程,我們也言必稱TCP/IP,似乎其它網(wǎng)絡(luò)協(xié)議已經(jīng)不存在了。對于TCP/IP,我們還知道TCP和UDP,前者可以保證數(shù)據(jù)的正確和可靠性,后者則允許數(shù)據(jù)丟失。最后,我們還知道,在建立連接前,必須知道對方的IP地址和端口號。除此,普通的程序員就不會(huì)知道太多了,很多時(shí)候這些知識已經(jīng)夠用了。最多,寫服務(wù)程序的時(shí)候,會(huì)使用多線程來處理并發(fā)訪問。
我們還知道如下幾個(gè)事實(shí):
1。一個(gè)指定的端口號不能被多個(gè)程序共用。比如,如果IIS占用了80端口,那么Apache就不能也用80端口了。
2。很多防火墻只允許特定目標(biāo)端口的數(shù)據(jù)包通過。
3。服務(wù)程序在listen某個(gè)端口并accept某個(gè)連接請求后,會(huì)生成一個(gè)新的socket來對該請求進(jìn)行處理。
于是,一個(gè)困惑了我很久的問題就產(chǎn)生了。如果一個(gè)socket創(chuàng)建后并與80端口綁定后,是否就意味著該socket占用了80端口呢?如果是這樣的,那么當(dāng)其accept一個(gè)請求后,生成的新的socket到底使用的是什么端口呢(我一直以為系統(tǒng)會(huì)默認(rèn)給其分配一個(gè)空閑的端口號)?如果是一個(gè)空閑的端口,那一定不是80端口了,于是以后的TCP數(shù)據(jù)包的目標(biāo)端口就不是80了--防火墻一定會(huì)組織其通過的!實(shí)際上,我們可以看到,防火墻并沒有阻止這樣的連接,而且這是最常見的連接請求和處理方式。我的不解就是,為什么防火墻沒有阻止這樣的連接?它是如何判定那條連接是因?yàn)閏onnet80端口而生成的?是不是TCP數(shù)據(jù)包里有什么特別的標(biāo)志?或者防火墻記住了什么東西?
后來,我又仔細(xì)研讀了TCP/IP的協(xié)議棧的原理,對很多概念有了更深刻的認(rèn)識。比如,在TCP和UDP同屬于傳輸層,共同架設(shè)在IP層(網(wǎng)絡(luò)層)之上。而IP層主要負(fù)責(zé)的是在節(jié)點(diǎn)之間(End to End)的數(shù)據(jù)包傳送,這里的節(jié)點(diǎn)是一臺網(wǎng)絡(luò)設(shè)備,比如計(jì)算機(jī)。因?yàn)镮P層只負(fù)責(zé)把數(shù)據(jù)送到節(jié)點(diǎn),而不能區(qū)分上面的不同應(yīng)用,所以TCP和UDP協(xié)議在其基礎(chǔ)上加入了端口的信息,端口于是標(biāo)識的是一個(gè)節(jié)點(diǎn)上的一個(gè)應(yīng)用。除了增加端口信息,UPD協(xié)議基本就沒有對IP層的數(shù)據(jù)進(jìn)行任何的處理了。而TCP協(xié)議還加入了更加復(fù)雜的傳輸控制,比如滑動(dòng)的數(shù)據(jù)發(fā)送窗口(Slice Window),以及接收確認(rèn)和重發(fā)機(jī)制,以達(dá)到數(shù)據(jù)的可靠傳送。不管應(yīng)用層看到的是怎樣一個(gè)穩(wěn)定的TCP數(shù)據(jù)流,下面?zhèn)魉偷亩际且粋€(gè)個(gè)的IP數(shù)據(jù)包,需要由TCP協(xié)議來進(jìn)行數(shù)據(jù)重組。
所以,我有理由懷疑,防火墻并沒有足夠的信息判斷TCP數(shù)據(jù)包的更多信息,除了IP地址和端口號。而且,我們也看到,所謂的端口,是為了區(qū)分不同的應(yīng)用的,以在不同的IP包來到的時(shí)候能夠正確轉(zhuǎn)發(fā)。
TCP/IP只是一個(gè)協(xié)議棧,就像操作系統(tǒng)的運(yùn)行機(jī)制一樣,必須要具體實(shí)現(xiàn),同時(shí)還要提供對外的操作接口。就像操作系統(tǒng)會(huì)提供標(biāo)準(zhǔn)的編程接口,比如Win32編程接口一樣,TCP/IP也必須對外提供編程接口,這就是Socket編程接口--原來是這么回事啊!
在Socket編程接口里,設(shè)計(jì)者提出了一個(gè)很重要的概念,那就是socket。這個(gè)socket跟文件句柄很相似,實(shí)際上在BSD系統(tǒng)里就是跟文件句柄一樣存放在一樣的進(jìn)程句柄表里。這個(gè)socket其實(shí)是一個(gè)序號,表示其在句柄表中的位置。這一點(diǎn),我們已經(jīng)見過很多了,比如文件句柄,窗口句柄等等。這些句柄,其實(shí)是代表了系統(tǒng)中的某些特定的對象,用于在各種函數(shù)中作為參數(shù)傳入,以對特定的對象進(jìn)行操作--這其實(shí)是C語言的問題,在C++語言里,這個(gè)句柄其實(shí)就是this指針,實(shí)際就是對象指針啦。
現(xiàn)在我們知道,socket跟TCP/IP并沒有必然的聯(lián)系。Socket編程接口在設(shè)計(jì)的時(shí)候,就希望也能適應(yīng)其他的網(wǎng)絡(luò)協(xié)議。所以,socket的出現(xiàn)只是可以更方便的使用TCP/IP協(xié)議棧而已,其對TCP/IP進(jìn)行了抽象,形成了幾個(gè)最基本的函數(shù)接口。比如create,listen,accept,connect,read和write等等。
現(xiàn)在我們明白,如果一個(gè)程序創(chuàng)建了一個(gè)socket,并讓其監(jiān)聽80端口,其實(shí)是向TCP/IP協(xié)議棧聲明了其對80端口的占有。以后,所有目標(biāo)是80端口的TCP數(shù)據(jù)包都會(huì)轉(zhuǎn)發(fā)給該程序(這里的程序,因?yàn)槭褂玫氖荢ocket編程接口,所以首先由Socket層來處理)。所謂accept函數(shù),其實(shí)抽象的是TCP的連接建立過程。accept函數(shù)返回的新socket其實(shí)指代的是本次創(chuàng)建的連接,而一個(gè)連接是包括兩部分信息的,一個(gè)是源IP和源端口,另一個(gè)是宿IP和宿端口。所以,accept可以產(chǎn)生多個(gè)不同的socket,而這些socket里包含的宿IP和宿端口是不變的,變化的只是源IP和源端口。這樣的話,這些socket宿端口就可以都是80,而Socket層還是能根據(jù)源/宿對來準(zhǔn)確地分辨出IP包和socket的歸屬關(guān)系,從而完成對TCP/IP協(xié)議的操作封裝!而同時(shí),放火墻的對IP包的處理規(guī)則也是清晰明了,不存在前面設(shè)想的種種復(fù)雜的情形。
明白socket只是對TCP/IP協(xié)議棧操作的抽象,而不是簡單的映射關(guān)系,這很重要!
1、TCP連接
手機(jī)能夠使用聯(lián)網(wǎng)功能是因?yàn)槭謾C(jī)底層實(shí)現(xiàn)了TCP/IP協(xié)議,可以使手機(jī)終端通過無線網(wǎng)絡(luò)建立TCP連接。TCP協(xié)議可以對上層網(wǎng)絡(luò)提供接口,使上層網(wǎng)絡(luò)數(shù)據(jù)的傳輸建立在“無差別”的網(wǎng)絡(luò)之上。
建立起一個(gè)TCP連接需要經(jīng)過“三次握手”:
第一次握手:客戶端發(fā)送syn包(syn=j)到服務(wù)器,并進(jìn)入SYN_SEND狀態(tài),等待服務(wù)器確認(rèn);
第二次握手:服務(wù)器收到syn包,必須確認(rèn)客戶的SYN(ack=j+1),同時(shí)自己也發(fā)送一個(gè)SYN包(syn=k),即SYN+ACK包,此時(shí)服務(wù)器進(jìn)入SYN_RECV狀態(tài);
第三次握手:客戶端收到服務(wù)器的SYN+ACK包,向服務(wù)器發(fā)送確認(rèn)包ACK(ack=k+1),此包發(fā)送完畢,客戶端和服務(wù)器進(jìn)入ESTABLISHED狀態(tài),完成三次握手。
握手過程中傳送的包里不包含數(shù)據(jù),三次握手完畢后,客戶端與服務(wù)器才正式開始傳送數(shù)據(jù)。理想狀態(tài)下,TCP連接一旦建立,在通信雙方中的任何一方主動(dòng)關(guān)閉連接之前,TCP 連接都將被一直保持下去。斷開連接時(shí)服務(wù)器和客戶端均可以主動(dòng)發(fā)起斷開TCP連接的請求,斷開過程需要經(jīng)過“四次握手”(過程就不細(xì)寫了,就是服務(wù)器和客戶端交互,最終確定斷開)
2、HTTP連接
HTTP協(xié)議即超文本傳送協(xié)議(Hypertext Transfer Protocol ),是Web聯(lián)網(wǎng)的基礎(chǔ),也是手機(jī)聯(lián)網(wǎng)常用的協(xié)議之一,HTTP協(xié)議是建立在TCP協(xié)議之上的一種應(yīng)用。
HTTP連接最顯著的特點(diǎn)是客戶端發(fā)送的每次請求都需要服務(wù)器回送響應(yīng),在請求結(jié)束后,會(huì)主動(dòng)釋放連接。從建立連接到關(guān)閉連接的過程稱為“一次連接”。
1)在HTTP 1.0中,客戶端的每次請求都要求建立一次單獨(dú)的連接,在處理完本次請求后,就自動(dòng)釋放連接。
2)在HTTP 1.1中則可以在一次連接中處理多個(gè)請求,并且多個(gè)請求可以重疊進(jìn)行,不需要等待一個(gè)請求結(jié)束后再發(fā)送下一個(gè)請求。
由于HTTP在每次請求結(jié)束后都會(huì)主動(dòng)釋放連接,因此HTTP連接是一種“短連接”,要保持客戶端程序的在線狀態(tài),需要不斷地向服務(wù)器發(fā)起連接請求。通常的做法是即時(shí)不需要獲得任何數(shù)據(jù),客戶端也保持每隔一段固定的時(shí)間向服務(wù)器發(fā)送一次“保持連接”的請求,服務(wù)器在收到該請求后對客戶端進(jìn)行回復(fù),表明知道客戶端“在線”。若服務(wù)器長時(shí)間無法收到客戶端的請求,則認(rèn)為客戶端“下線”,若客戶端長時(shí)間無法收到服務(wù)器的回復(fù),則認(rèn)為網(wǎng)絡(luò)已經(jīng)斷開。
3、SOCKET原理
3.1套接字(socket)概念
套接字(socket)是通信的基石,是支持TCP/IP協(xié)議的網(wǎng)絡(luò)通信的基本操作單元。它是網(wǎng)絡(luò)通信過程中端點(diǎn)的抽象表示,包含進(jìn)行網(wǎng)絡(luò)通信必須的五種信息:連接使用的協(xié)議,本地主機(jī)的IP地址,本地進(jìn)程的協(xié)議端口,遠(yuǎn)地主機(jī)的IP地址,遠(yuǎn)地進(jìn)程的協(xié)議端口。
應(yīng)用層通過傳輸層進(jìn)行數(shù)據(jù)通信時(shí),TCP會(huì)遇到同時(shí)為多個(gè)應(yīng)用程序進(jìn)程提供并發(fā)服務(wù)的問題。多個(gè)TCP連接或多個(gè)應(yīng)用程序進(jìn)程可能需要通過同一個(gè) TCP協(xié)議端口傳輸數(shù)據(jù)。為了區(qū)別不同的應(yīng)用程序進(jìn)程和連接,許多計(jì)算機(jī)操作系統(tǒng)為應(yīng)用程序與TCP/IP協(xié)議交互提供了套接字(Socket)接口。應(yīng)用層可以和傳輸層通過Socket接口,區(qū)分來自不同應(yīng)用程序進(jìn)程或網(wǎng)絡(luò)連接的通信,實(shí)現(xiàn)數(shù)據(jù)傳輸?shù)牟l(fā)服務(wù)