《網(wǎng)絡(luò)架構(gòu)系列2-Http詳解》

不詩意的女程序媛不是好廚師~
轉(zhuǎn)載請注明出處,F(xiàn)rom李詩雨---https://blog.csdn.net/cjm2484836553/article/details/104136511

在這里插入圖片描述

1. Http的協(xié)議簡介

1.1什么是Http?

HTTP即:Hyper Text Transfer Protocol(超文本傳輸協(xié)議)的縮寫。

它是用于從萬維網(wǎng)(WWW:World
Wide Web )服務(wù)器傳輸超文本到本地瀏覽器的傳送協(xié)議。

HTTP是一個基于TCP/IP通信協(xié)議來傳遞數(shù)據(jù)(HTML 文件, 圖片文件, 查詢結(jié)果等)。

1.2 Http的三個特點

HTTP三點注意事項:

  • HTTP是無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)器處理完客戶的請求,并收到客戶的應(yīng)答后,即斷開連接。采用這種方式可以節(jié)省傳輸時間。
  • HTTP是媒體獨立的:這意味著,只要客戶端和服務(wù)器知道如何處理的數(shù)據(jù)內(nèi)容,任何類型的數(shù)據(jù)都可以通過HTTP發(fā)送??蛻舳艘约胺?wù)器指定使用適合的MIME-type內(nèi)容類型。
  • HTTP是無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面,在服務(wù)器不需要先前信息時它的應(yīng)答就較快。

1.3 Http的歷史

  • 1991年 Http/0.9 只有Get命令,只能獲取文本信息。
  • 1996年 Http/1.0 標(biāo)準(zhǔn)版本 豐富了命令,可以發(fā)送任何格式內(nèi)容(文字、圖像、視頻、二進制文件等)。
  • 1997年Http/1.1 一直比較流行的版本 引入持久連接,TCP默認(rèn)不關(guān)閉,可被多個請求復(fù)用。
  • 2015年Http/2.0 采用二進制格式而非文本格式,允許服務(wù)器主動推送。
在這里插入圖片描述

2.Http的報文格式

2.1 Http請求報文

在這里插入圖片描述

一個HTTP請求報文由四個部分組成:請求行、請求頭部、空行、請求數(shù)據(jù)。

  • 請求行由請求方法字段、URL字段和HTTP協(xié)議版本字段3個字段組成,它們用空格分隔。

  • 請求頭部:Http客戶程序(例如瀏覽器),向服務(wù)器發(fā)送請求的時候必須指明請求類型(一般是GET或者 POST)。

    如有必要,客戶程序還可以選擇發(fā)送其他的請求頭。大多數(shù)請求頭并不是必需的,但Content-Length除外。

    對于POST請求來說 Content-Length必須出現(xiàn)。

    還有下文說的緩存機制的相關(guān)信息也放在請求頭中。

  • 空行: 它的作用是通過一個空行,告訴服務(wù)器請求頭部到此為止。

  • 請求數(shù)據(jù): 若方法字段是GET,則此項為空,沒有數(shù)據(jù)

    若方法字段是POST,則通常來說此處放置的就是要提交的數(shù)據(jù)

    比如要使用POST方法提交一個表單,其中有user字段中數(shù)據(jù)為“admin”, password字段為123abc,那么這里的請求數(shù)據(jù)就是 user=admin&password=123abc,使用&來連接各個字段。

概括點來說,HTTP請求報文格式如下:

在這里插入圖片描述

2.2 Http響應(yīng)報文

同樣的,HTTP響應(yīng)報文也由四部分組成:響應(yīng)行、響應(yīng)頭、空行、響應(yīng)體

  • 響應(yīng)行: 一般由協(xié)議版本、狀態(tài)碼及其描述組成 如 HTTP/1.1 200 OK
  • 響應(yīng)頭: 用于描述服務(wù)器的基本信息,以及數(shù)據(jù)的描述,服務(wù)器通過這些數(shù)據(jù)的描述信息,可以通知客戶端如何處理等一會兒它回送的數(shù)據(jù)。如下文要說的一些緩存信息。
  • 空行: 它的作用是通過一個空行,告訴服務(wù)器請求頭部到此為止。
  • 響應(yīng)體: 就是響應(yīng)的消息體,如果是純數(shù)據(jù)就是返回純數(shù)據(jù),如果請求的是HTML頁面,那么返回的就是HTML代碼,如果是js就是JS代碼,如此之類。

3.Http請求的傳輸過程

像穿衣服一樣,早上起床是:由里向外的一層一層穿上;

睡覺時,再從外到里的一層一層脫下。

或者說像洋蔥~~~總之你理解就好。

在這里插入圖片描述

4.一次完整Http請求的過程(面試點▲▲▲)

面試時經(jīng)常會被問到,“請說一下一次完整的Http請求過程是怎樣的”?

那么到底是怎樣的呢?請看下文:

  • 域名解析

    這個是由于,socket只認(rèn)識ip地址,不認(rèn)識域名,所以要先進行域名解析。

  • 建立TCP連接

    HTTP 是比 TCP 更高層次的應(yīng)用層協(xié)議,根據(jù)規(guī)則,只有低層協(xié)議建立之后才能進行更高層協(xié)議的連接,因此,首先要建立 TCP 連接。TCP通過三次握手建立連接,在前一篇文章中說過。

  • 瀏覽器向服務(wù)器發(fā)送請求命令

    一旦建立了 TCP 連接,Web 瀏覽器就會向 Web 服務(wù)器發(fā)送請求命令。

    例如:GET/hello/index.jsp HTTP/1.1。瀏覽器發(fā)送其請求命令之后,還要以頭信息的形式向Web服務(wù)器發(fā)送一些別的信息(例:Accept ,User-Agent 等),之后瀏覽器發(fā)送了一空白行來通知服務(wù)器,它已經(jīng)結(jié)束了該頭信息的發(fā)送。

  • Web服務(wù)器應(yīng)答

    客戶端向服務(wù)器發(fā)出請求后,服務(wù)器會進行應(yīng)答。

  • Web服務(wù)器關(guān)閉TCP連接

    一般情況下,一旦 Web 服務(wù)器向瀏覽器發(fā)送了請求的數(shù)據(jù),它就要關(guān)閉 TCP 連接。

    但是如果瀏覽器或者服務(wù)器在其頭信息加入了這行代碼:Connection:keep-alive,TCP連接在發(fā)送后將仍然保持打開狀態(tài),于是,瀏覽器可以繼續(xù)通過相同的連接發(fā)送請求。保持連接節(jié)省了為每個請求建立新連接所需的時間,還節(jié)約了網(wǎng)絡(luò)帶寬。

  • 瀏覽器接受到服務(wù)器響應(yīng)的數(shù)據(jù)

    瀏覽器接受服務(wù)器應(yīng)答回來的 html 代碼和css,和js代碼再進行頁面的渲染或者接受到應(yīng)答的文件進行保存等操作。

概括一下流程就是:

瀏覽器發(fā)起請求 → 解析域名得到ip→進行TCP連接 →瀏覽器發(fā)送HTTP請求和頭信息發(fā)送→服務(wù)器對瀏覽器進行應(yīng)答,響應(yīng)頭信息和瀏覽器所需的內(nèi)容→ 關(guān)閉TCP連接或保持→瀏覽器得到數(shù)據(jù)數(shù)據(jù)進行操作

5.Http的緩存機制及原理(面試點▲▲▲)

關(guān)于緩存機制和原理這部分內(nèi)容,我看到了一篇寫得極好的文章:https://www.cnblogs.com/chenqf/p/6386163.html ,所以這一部分的內(nèi)容我就直接轉(zhuǎn)載了。

5.1 先來大概了解一下兩種緩存規(guī)則

HTTP緩存有多種規(guī)則,根據(jù)是否需要重新向服務(wù)器發(fā)起請求來分類,我將其分為兩大類(強制緩存,對比緩存)

下面我們通過時序圖的方式來學(xué)習(xí)兩種緩存規(guī)則:

為方便大家理解,我們認(rèn)為瀏覽器存在一個緩存數(shù)據(jù)庫,用于存儲緩存信息。
在客戶端第一次請求數(shù)據(jù)時,此時緩存數(shù)據(jù)庫中沒有對應(yīng)的緩存數(shù)據(jù),需要請求服務(wù)器,服務(wù)器返回后,將數(shù)據(jù)存儲至緩存數(shù)據(jù)庫中。

在這里插入圖片描述

然后,我們再分別來看看強制緩存和對比緩存的時序圖~

已存在緩存數(shù)據(jù)時,僅基于強制緩存,請求數(shù)據(jù)的流程如下:

在這里插入圖片描述

已存在緩存數(shù)據(jù)時,僅基于對比緩存,請求數(shù)據(jù)的流程如下:

在這里插入圖片描述

我們可以看到兩類緩存規(guī)則的不同,強制緩存如果生效,不需要再和服務(wù)器發(fā)生交互,而對比緩存不管是否生效,都需要與服務(wù)端發(fā)生交互。
兩類緩存規(guī)則可以同時存在,強制緩存優(yōu)先級高于對比緩存,也就是說,當(dāng)執(zhí)行強制緩存的規(guī)則時,如果緩存生效,直接使用緩存,不再執(zhí)行對比緩存規(guī)則。

問題: 基于對比緩存的流程下,不管是否使用緩存,都需要向服務(wù)器發(fā)送請求,那么還用緩存干什么?

答案是: 服務(wù)端在進行標(biāo)識比較后,只返回header部分,通過狀態(tài)碼通知客戶端使用緩存,不再需要將報文主體部分返回給客戶端。所以,在對比緩存生效時,狀態(tài)碼為304,報文大小和請求時間都會大大減少。

5.2 強制緩存

從上文我們知道,強制緩存,在緩存數(shù)據(jù)未失效的情況下,可以直接使用緩存數(shù)據(jù),那么瀏覽器是如何判斷緩存數(shù)據(jù)是否失效呢?
我們知道,在沒有緩存數(shù)據(jù)的時候,瀏覽器向服務(wù)器請求數(shù)據(jù)時,服務(wù)器會將數(shù)據(jù)和緩存規(guī)則一并返回,緩存規(guī)則信息包含在響應(yīng)header中。

對于強制緩存來說,響應(yīng)header中會有兩個字段來標(biāo)明失效規(guī)則 Expires/Cache-Control
使用chrome的開發(fā)者工具,可以很明顯的看到對于強制緩存生效時,網(wǎng)絡(luò)請求的情況

在這里插入圖片描述

Expires
  Expires的值為服務(wù)端返回的到期時間,即下一次請求時,請求時間小于服務(wù)端返回的到期時間,直接使用緩存數(shù)據(jù)。
不過Expires 是HTTP 1.0的東西,現(xiàn)在默認(rèn)瀏覽器均默認(rèn)使用HTTP 1.1,所以它的作用基本忽略。
另一個問題是,到期時間是由服務(wù)端生成的,但是客戶端時間可能跟服務(wù)端時間有誤差,這就會導(dǎo)致緩存命中的誤差。
所以HTTP 1.1 的版本,使用Cache-Control替代。

Cache-Control
Cache-Control 是最重要的規(guī)則。常見的取值有private、public、no-cache、max-age,no-store,默認(rèn)為private。
private: 客戶端可以緩存
public: 客戶端和代理服務(wù)器都可緩存(前端的同學(xué),可以認(rèn)為public和private是一樣的)
max-age=xxx: 緩存的內(nèi)容將在 xxx 秒后失效
no-cache: 需要使用對比緩存來驗證緩存數(shù)據(jù)(后面介紹)
no-store: 所有內(nèi)容都不會緩存,強制緩存,對比緩存都不會觸發(fā)(對于前端開發(fā)來說,緩存越多越好,so...基本上和它說886)

5.3 對比緩存

對比緩存,顧名思義,需要進行比較判斷是否可以使用緩存。
瀏覽器第一次請求數(shù)據(jù)時,服務(wù)器會將緩存標(biāo)識與數(shù)據(jù)一起返回給客戶端,客戶端將二者備份至緩存數(shù)據(jù)庫中。
再次請求數(shù)據(jù)時,客戶端將備份的緩存標(biāo)識發(fā)送給服務(wù)器,服務(wù)器根據(jù)緩存標(biāo)識進行判斷,判斷成功后,返回304狀態(tài)碼,通知客戶端比較成功,可以使用緩存數(shù)據(jù)。

第一次訪問的截圖:


在這里插入圖片描述

再次訪問的截圖:


在這里插入圖片描述

通過兩圖的對比,我們可以很清楚的發(fā)現(xiàn),在對比緩存生效時,狀態(tài)碼為304,并且報文大小和請求時間大大減少。
原因是,服務(wù)端在進行標(biāo)識比較后,只返回header部分,通過狀態(tài)碼通知客戶端使用緩存,不再需要將報文主體部分返回給客戶端。

對于對比緩存來說,緩存標(biāo)識的傳遞是我們著重需要理解的,它在請求header和響應(yīng)header間進行傳遞,
一共分為兩種標(biāo)識傳遞,接下來,我們分開介紹。

Last-Modified / If-Modified-Since

Last-Modified:
服務(wù)器在響應(yīng)請求時,告訴瀏覽器資源的最后修改時間。

在這里插入圖片描述

If-Modified-Since:
再次請求服務(wù)器時,通過此字段通知服務(wù)器上次請求時,服務(wù)器返回的資源最后修改時間。
服務(wù)器收到請求后發(fā)現(xiàn)有頭If-Modified-Since 則與被請求資源的最后修改時間進行比對。
若資源的最后修改時間大于If-Modified-Since,說明資源又被改動過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
若資源的最后修改時間小于或等于If-Modified-Since,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。

在這里插入圖片描述

Etag / If-None-Match

優(yōu)先級高于Last-Modified / If-Modified-Since

Etag:
服務(wù)器響應(yīng)請求時,告訴瀏覽器當(dāng)前資源在服務(wù)器的唯一標(biāo)識(生成規(guī)則由服務(wù)器決定)。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-lEQKnjrZ-1580551223283)(G:\新建文件夾\騰訊課堂\學(xué)習(xí)筆記\網(wǎng)絡(luò)框架公開課\pic\響應(yīng)頭3.png)]

If-None-Match:
再次請求服務(wù)器時,通過此字段通知服務(wù)器客戶段緩存數(shù)據(jù)的唯一標(biāo)識。
服務(wù)器收到請求后發(fā)現(xiàn)有頭If-None-Match 則與被請求資源的唯一標(biāo)識進行比對,
不同,說明資源又被改動過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
相同,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-CQO9YbAh-1580551223286)(G:\新建文件夾\騰訊課堂\學(xué)習(xí)筆記\網(wǎng)絡(luò)框架公開課\pic\相應(yīng)頭4.png)]

總結(jié)

對于強制緩存,服務(wù)器通知瀏覽器一個緩存時間,在緩存時間內(nèi),下次請求,直接用緩存,不在時間內(nèi),執(zhí)行比較緩存策略。對于比較緩存,將緩存信息中的Etag和Last-Modified通過請求發(fā)送給服務(wù)器,由服務(wù)器校驗,返回304狀態(tài)碼時,瀏覽器直接使用緩存。

瀏覽器第一次請求:

在這里插入圖片描述

瀏覽器再次請求:

在這里插入圖片描述
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容