網(wǎng)絡(luò)編程
計(jì)算機(jī)網(wǎng)絡(luò)就是把各個(gè)計(jì)算機(jī)連接到一起,讓網(wǎng)絡(luò)中的計(jì)算機(jī)可以互相通信。網(wǎng)絡(luò)編程就是如何在程序中實(shí)現(xiàn)兩臺(tái)計(jì)算機(jī)的通信。
更確切地說,網(wǎng)絡(luò)通信是兩臺(tái)計(jì)算機(jī)上的兩個(gè)進(jìn)程之間的通信。比如,瀏覽器進(jìn)程和新浪服務(wù)器上的某個(gè)Web服務(wù)進(jìn)程在通信,而QQ進(jìn)程是和騰訊的某個(gè)服務(wù)器上的某個(gè)進(jìn)程在通信。
用Python進(jìn)行網(wǎng)絡(luò)編程,就是在Python程序本身這個(gè)進(jìn)程內(nèi),連接別的服務(wù)器進(jìn)程的通信端口進(jìn)行通信。
本章我們將詳細(xì)介紹Python網(wǎng)絡(luò)編程的概念和最主要的兩種網(wǎng)絡(luò)類型的編程。
TCP/IP簡介
為了把全世界的所有不同類型的計(jì)算機(jī)都連接起來,就必須規(guī)定一套全球通用的協(xié)議,為了實(shí)現(xiàn)互聯(lián)網(wǎng)這個(gè)目標(biāo),互聯(lián)網(wǎng)協(xié)議簇(Internet Protocol Suite)就是通用協(xié)議標(biāo)準(zhǔn)。有了Internet,任何私有網(wǎng)絡(luò),只要支持這個(gè)協(xié)議,就可以聯(lián)入互聯(lián)網(wǎng)。
因?yàn)榛ヂ?lián)網(wǎng)協(xié)議包含了上百種協(xié)議標(biāo)準(zhǔn),但是最重要的兩個(gè)協(xié)議是TCP和IP協(xié)議,所以,大家把互聯(lián)網(wǎng)的協(xié)議簡稱TCP/IP協(xié)議。
通信的時(shí)候,雙方必須知道對(duì)方的標(biāo)識(shí)。互聯(lián)網(wǎng)上每個(gè)計(jì)算機(jī)的唯一標(biāo)識(shí)就是IP地址。如果一臺(tái)計(jì)算機(jī)同時(shí)接入到兩個(gè)或更多的網(wǎng)絡(luò),比如路由器,它就會(huì)有兩個(gè)或多個(gè)IP地址,所以,IP地址對(duì)應(yīng)的實(shí)際上是計(jì)算機(jī)的網(wǎng)絡(luò)接口,通常是網(wǎng)卡。
IP協(xié)議負(fù)責(zé)把數(shù)據(jù)從一臺(tái)計(jì)算機(jī)通過網(wǎng)絡(luò)發(fā)送到另一臺(tái)計(jì)算機(jī)。數(shù)據(jù)被分割成一小塊一小塊,然后通過IP包發(fā)送出去。由于互聯(lián)網(wǎng)鏈路復(fù)雜,兩臺(tái)計(jì)算機(jī)之間經(jīng)常有多條線路,因此,路由器就負(fù)責(zé)決定如何把一個(gè)IP包轉(zhuǎn)發(fā)出去。IP包的特點(diǎn)是按塊發(fā)送,途徑多個(gè)路由,但不保證能到達(dá),也不保證順序到達(dá)。

IP地址實(shí)際上是一個(gè)32位整數(shù)(稱為IPv4),以字符串表示的IP地址如192.168.0.1實(shí)際上是把32位整數(shù)按8位分組后的數(shù)字表示,目的是便于閱讀。
IPv6地址實(shí)際上是一個(gè)128位整數(shù),它是目前使用的IPv4的升級(jí)版,以字符串表示類似于2001:0db8:85a3:0042:1000:8a2e:0370:7334。
TCP協(xié)議則是建立在IP協(xié)議之上的。TCP協(xié)議負(fù)責(zé)在兩臺(tái)計(jì)算機(jī)之間建立可靠連接,保證數(shù)據(jù)包按順序到達(dá)。TCP協(xié)議會(huì)通過握手建立連接,然后,對(duì)每個(gè)IP包編號(hào),確保對(duì)方按順序收到,如果包丟掉了,就自動(dòng)重發(fā)。
許多常用的更高級(jí)的協(xié)議都是建立在TCP協(xié)議基礎(chǔ)上的,比如用于瀏覽器的HTTP協(xié)議、發(fā)送郵件的SMTP協(xié)議等。
一個(gè)TCP報(bào)文除了包含要傳輸?shù)臄?shù)據(jù)外,還包含源IP地址和目標(biāo)IP地址,源端口和目標(biāo)端口。
端口有什么作用?在兩臺(tái)計(jì)算機(jī)通信時(shí),只發(fā)IP地址是不夠的,因?yàn)橥慌_(tái)計(jì)算機(jī)上跑著多個(gè)網(wǎng)絡(luò)程序。一個(gè)TCP報(bào)文來了之后,到底是交給瀏覽器還是QQ,就需要端口號(hào)來區(qū)分。每個(gè)網(wǎng)絡(luò)程序都向操作系統(tǒng)申請(qǐng)唯一的端口號(hào),這樣,兩個(gè)進(jìn)程在兩臺(tái)計(jì)算機(jī)之間建立網(wǎng)絡(luò)連接就需要各自的IP地址和各自的端口號(hào)。
一個(gè)進(jìn)程也可能同時(shí)與多個(gè)計(jì)算機(jī)建立鏈接,因此它會(huì)申請(qǐng)很多端口。
TCP編程
Socket是網(wǎng)絡(luò)編程的一個(gè)抽象概念。通常我們用一個(gè)Socket表示“打開了一個(gè)網(wǎng)絡(luò)鏈接”,而打開一個(gè)Socket需要知道目標(biāo)計(jì)算機(jī)的IP地址和端口號(hào),再指定協(xié)議類型即可。
客戶端
大多數(shù)連接都是可靠的TCP連接。創(chuàng)建TCP連接時(shí),主動(dòng)發(fā)起連接的叫客戶端,被動(dòng)響應(yīng)連接的叫服務(wù)器。
所以,我們要?jiǎng)?chuàng)建一個(gè)基于TCP連接的Socket,可以這樣做:
# 導(dǎo)入socket庫:
import socket
# 創(chuàng)建一個(gè)socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立連接:
s.connect(('www.sina.com.cn', 80))
創(chuàng)建Socket時(shí),AF_INET指定使用IPv4協(xié)議,如果要用更先進(jìn)的IPv6,就指定為AF_INET6。SOCK_STREAM指定使用面向流的TCP協(xié)議,這樣,一個(gè)Socket對(duì)象就創(chuàng)建成功,但是還沒有建立連接。
客戶端要主動(dòng)發(fā)起TCP連接,必須知道服務(wù)器的IP地址和端口號(hào)。新浪網(wǎng)站的IP地址可以用域名www.sina.com.cn自動(dòng)轉(zhuǎn)換到IP地址,作為服務(wù)器,提供什么樣的服務(wù),端口號(hào)就必須固定下來,新浪提供網(wǎng)頁服務(wù)的服務(wù)器必須把端口號(hào)固定在80端口,因?yàn)?0端口是Web服務(wù)的標(biāo)準(zhǔn)端口。
其他服務(wù)都有對(duì)應(yīng)的標(biāo)準(zhǔn)端口號(hào),例如SMTP服務(wù)是25端口,F(xiàn)TP服務(wù)是21端口,等等。端口號(hào)小于1024的是Internet標(biāo)準(zhǔn)服務(wù)的端口,端口號(hào)大于1024的,可以任意使用。
注意我們連接新浪服務(wù)器的參數(shù)是一個(gè)tuple,包含地址和端口號(hào)。
建立TCP連接后,我們就可以向新浪服務(wù)器發(fā)送請(qǐng)求,要求返回首頁的內(nèi)容:
# 發(fā)送數(shù)據(jù):
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
TCP連接創(chuàng)建的是雙向通道,雙方都可以同時(shí)給對(duì)方發(fā)數(shù)據(jù)。但是誰先發(fā)誰后發(fā),怎么協(xié)調(diào),要根據(jù)具體的協(xié)議來決定。例如,HTTP協(xié)議規(guī)定客戶端必須先發(fā)請(qǐng)求給服務(wù)器,服務(wù)器收到后才發(fā)數(shù)據(jù)給客戶端。
發(fā)送的文本格式必須符合HTTP標(biāo)準(zhǔn),如果格式?jīng)]問題,接下來就可以接收新浪服務(wù)器返回的數(shù)據(jù)了:
# 接收數(shù)據(jù):
buffer = []
while True:
# 每次最多接收1k字節(jié):
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
# 關(guān)閉連接:
s.close()
接收數(shù)據(jù)時(shí),調(diào)用recv(max)方法,一次最多接收指定的字節(jié)數(shù),因此,在一個(gè)while循環(huán)中反復(fù)接收,直到recv()返回空數(shù)據(jù),表示接收完畢,退出循環(huán)。
當(dāng)我們接收完數(shù)據(jù)后,調(diào)用close()方法關(guān)閉Socket,這樣,一次完整的網(wǎng)絡(luò)通信就結(jié)束了。
接收到的數(shù)據(jù)包括HTTP頭和網(wǎng)頁本身,我們只需要把HTTP頭和網(wǎng)頁分離一下,把HTTP頭打印出來,網(wǎng)頁內(nèi)容保存到文件:
header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的數(shù)據(jù)寫入文件:
with open('sina.html', 'wb') as f:
f.write(html)
現(xiàn)在,只需要在瀏覽器中打開這個(gè)sina.html文件,就可以看到新浪的首頁了。
服務(wù)端
服務(wù)器進(jìn)程首先要綁定一個(gè)端口并監(jiān) 聽來自其他客戶端的連接。如果某個(gè)客戶端連接過來了,服務(wù)器就與該客戶端建立Socket連接,隨后的通信就靠這個(gè)Socket連接了。
所以,服務(wù)器會(huì)打開固定端口(比如80)監(jiān)聽,每來一個(gè)客戶端連接,就創(chuàng)建該Socket連接。由于服務(wù)器會(huì)有大量來自客戶端的連接,所以,服務(wù)器要能夠區(qū)分一個(gè)Socket連接是和哪個(gè)客戶端綁定的。一個(gè)Socket依賴4項(xiàng):服務(wù)器地址、服務(wù)器端口、客戶端地址、客戶端端口來唯一確定一個(gè)Socket。
但是服務(wù)器還需要同時(shí)響應(yīng)多個(gè)客戶端的請(qǐng)求,所以,每個(gè)連接都需要一個(gè)新的進(jìn)程或者新的線程來處理,否則,服務(wù)器一次就只能服務(wù)一個(gè)客戶端了。
我們來編寫一個(gè)簡單的服務(wù)器程序,它接收客戶端連接,把客戶端發(fā)過來的字符串加上Hello再發(fā)回去。
我們要綁定監(jiān)聽的地址和端口。服務(wù)器可能有多塊網(wǎng)卡,可以綁定到某一塊網(wǎng)卡的IP地址上,也可以用0.0.0.0綁定到所有的網(wǎng)絡(luò)地址,還可以用127.0.0.1綁定到本機(jī)地址。127.0.0.1是一個(gè)特殊的IP地址,表示本機(jī)地址,如果綁定到這個(gè)地址,客戶端必須同時(shí)在本機(jī)運(yùn)行才能連接,也就是說,外部的計(jì)算機(jī)無法連接進(jìn)來。
端口號(hào)需要預(yù)先指定。因?yàn)槲覀儗懙倪@個(gè)服務(wù)不是標(biāo)準(zhǔn)服務(wù),所以用9999這個(gè)端口號(hào)。請(qǐng)注意,小于1024的端口號(hào)必須要有管理員權(quán)限才能綁定。緊接著,調(diào)用listen()方法開始監(jiān)聽端口,傳入的參數(shù)指定等待連接的最大數(shù)量:
# 創(chuàng)建基于IPv4和TCP協(xié)議的Socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 監(jiān)聽端口:
s.bind(('127.0.0.1', 9999))
s.listen(5)
print('Waiting for connection...')
接下來,服務(wù)器程序通過一個(gè)永久循環(huán)來接受來自客戶端的連接,accept()會(huì)等待并返回一個(gè)客戶端的連接。每個(gè)連接都必須創(chuàng)建新線程(或進(jìn)程)來處理,否則,單線程在處理連接的過程中,無法接受其他客戶端的連接:
while True:
# 接受一個(gè)新連接:
sock, addr = s.accept()
# 創(chuàng)建新線程來處理TCP連接:
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)
連接建立后,服務(wù)器首先發(fā)一條歡迎消息,然后等待客戶端數(shù)據(jù),并加上Hello再發(fā)送給客戶端。如果客戶端發(fā)送了exit字符串,就直接關(guān)閉連接。
要測試這個(gè)服務(wù)器程序,我們還需要編寫一個(gè)客戶端程序:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立連接:
s.connect(('127.0.0.1', 9999))
# 接收歡迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
# 發(fā)送數(shù)據(jù):
s.send(data)
print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()
我們需要打開兩個(gè)命令行窗口,一個(gè)運(yùn)行服務(wù)器程序,另一個(gè)運(yùn)行客戶端程序,就可以看到效果了:

需要注意的是,客戶端程序運(yùn)行完畢就退出了,而服務(wù)器程序會(huì)永遠(yuǎn)運(yùn)行下去,必須按Ctrl+C退出程序。
同一個(gè)端口,被一個(gè)Socket綁定了以后,就不能被別的Socket綁定了。
UDP編程
TCP是建立可靠連接,并且通信雙方都可以以流的形式發(fā)送數(shù)據(jù)。相對(duì)TCP,UDP則是面向無連接的協(xié)議。
使用UDP協(xié)議時(shí),不需要建立連接,只需要知道對(duì)方的IP地址和端口號(hào),就可以直接發(fā)數(shù)據(jù)包。但是,能不能到達(dá)就不知道了。
雖然用UDP傳輸數(shù)據(jù)不可靠,但它的優(yōu)點(diǎn)是和TCP比,速度快,對(duì)于不要求可靠到達(dá)的數(shù)據(jù),就可以使用UDP協(xié)議。
我們來看看如何通過UDP協(xié)議傳輸數(shù)據(jù)。和TCP類似,使用UDP的通信雙方也分為客戶端和服務(wù)器。服務(wù)器首先需要綁定端口:
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 綁定端口:
s.bind(('127.0.0.1', 9999))
創(chuàng)建Socket時(shí),SOCK_DGRAM指定了這個(gè)Socket的類型是UDP。綁定端口和TCP一樣,但是不需要調(diào)用listen()方法,而是直接接收來自任何客戶端的數(shù)據(jù):
print('Bind UDP on 9999...')
while True:
# 接收數(shù)據(jù):
data, addr = s.recvfrom(1024)
print('Received from %s:%s.' % addr)
s.sendto(b'Hello, %s!' % data, addr)
recvfrom()方法返回?cái)?shù)據(jù)和客戶端的地址與端口,這樣,服務(wù)器收到數(shù)據(jù)后,直接調(diào)用sendto()就可以把數(shù)據(jù)用UDP發(fā)給客戶端。
注意這里省掉了多線程,因?yàn)檫@個(gè)例子很簡單。
客戶端使用UDP時(shí),首先仍然創(chuàng)建基于UDP的Socket,然后,不需要調(diào)用connect(),直接通過sendto()給服務(wù)器發(fā)數(shù)據(jù):
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
for data in [b'Michael', b'Tracy', b'Sarah']:
# 發(fā)送數(shù)據(jù):
s.sendto(data, ('127.0.0.1', 9999))
# 接收數(shù)據(jù):
print(s.recv(1024).decode('utf-8'))
s.close()
從服務(wù)器接收數(shù)據(jù)仍然調(diào)用recv()方法。
服務(wù)器綁定UDP端口和TCP端口互不沖突,也就是說,UDP的9999端口與TCP的9999端口可以各自綁定。
愿早日戰(zhàn)勝新冠病毒!不要忘記點(diǎn)贊收藏或轉(zhuǎn)發(fā),感謝支持~
學(xué)習(xí)筆記來自廖雪峰官方網(wǎng)站