《圖解HTTP》學(xué)習(xí)筆記(三):HTTP報(bào)文內(nèi)的HTTP信息

HTTP報(bào)文

  • 用于HTTP協(xié)議交互的信息被稱作為HTTP報(bào)文。請求端和服務(wù)端分別被叫做請求報(bào)文和響應(yīng)報(bào)文。HTTP報(bào)文由報(bào)文首部和報(bào)文主體組成,首部和主體之間由【CR+LF】換行分割,一個(gè)HTTP報(bào)文不一定需要報(bào)文主體。

  • 請求報(bào)文首部:請求行、請求首部字段、通用首部字段、實(shí)體首部字段、其他。

  • 響應(yīng)報(bào)文首部:狀態(tài)行、響應(yīng)首部字段、通用首部字段、實(shí)體首部字段、其他。

  • 請求報(bào)文:

    GET / HTTP/1.1  --請求行
    Host:www.baidu.com
    User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36
    Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
    Accept-Language:zh-CN,zh;q=0.8,en;q=0.6
    Accept-Encoding:gzip, deflate, br
    Upgrade-Insecure-Requests:1
    Cache-Control:max-age=0
    Connection:keep-alive                --各種首部字段
    (CR-LF) --空行
    
  • 響應(yīng)報(bào)文:

    HTTP/1.1 200 OK -- 狀態(tài)行
    Bdpagetype:2
    Bdqid:0xb377d200000097b1
    Bduserid:1270621848
    Cache-Control:private
    Connection:Keep-Alive
    Content-Encoding:gzip
    Content-Type:text/html;charset=utf-8
    Date:Wed, 18 Oct 2017 05:57:28 GMT
    Expires:Wed, 18 Oct 2017 05:57:28 GMT
    Server:BWS/1.1
    Set-Cookie:BDSVRTM=187; path=/
    Set-Cookie:BD_HOME=1; path=/
    Set-Cookie:H_PS_PSSID=1450_21119_20929; path=/; domain=.baidu.com
    Strict-Transport-Security:max-age=172800
    Transfer-Encoding:chunked
    X-Ua-Compatible:IE=Edge,chrome=1    -- 各種首部字段
    (CR-LF) -- 空行
    <!Doctype html>
    <html xmlns=http://www.w3.org/1999/xhtml>
    <head>
    ...                                 -- 響應(yīng)主體
    
  • 請求報(bào)文和響應(yīng)報(bào)文的首部內(nèi)容由以下數(shù)據(jù)組成:

    • 請求行: 包含用于請求的方法,請求的URI和HTTP版本
    • 狀態(tài)行: 包含表面闡述響應(yīng)結(jié)果的狀態(tài)碼,原因短語和HTTP版本
    • 首部字段:包含表示請求和響應(yīng)結(jié)果的各種條件和屬性的各類首部。一般有4中首部,分別是:通用首部、請求首部、響應(yīng)首部、實(shí)體首部。
    • 其他: 可能包含HTTP的RFC里沒有定義的首部(Cookie等)。
  • 編碼提升傳輸效率

    通過在傳輸時(shí)編碼,能有效地處理大量的訪問請求。但是,編碼的操作需要計(jì)算機(jī)來完成,因此會(huì)消耗更多的CPU等資源。

    • 報(bào)文主體和實(shí)體主體的差異

      • 報(bào)文

        是HTTP通信中的基本你單位,由8位字節(jié)流組成,通過HTTP通信傳輸。

      • 實(shí)體

        作為請求或響應(yīng)的有效載荷數(shù)據(jù)被傳輸,其內(nèi)容由實(shí)體首部和實(shí)體主體組成。

      HTTP報(bào)文的主體用于傳輸請求或響應(yīng)的實(shí)體主體。

      通常,報(bào)文主體等于實(shí)體主體,只有在傳輸中進(jìn)行編碼操作,實(shí)體主體的內(nèi)容會(huì)發(fā)生變化,才導(dǎo)致它和報(bào)文主體產(chǎn)生差異。

  • 壓縮傳輸?shù)膬?nèi)容編碼

    HTTP協(xié)議中有一種被稱為內(nèi)容編碼的功能也能進(jìn)行類型的操作,內(nèi)容編碼指明應(yīng)用在實(shí)體內(nèi)容上的編碼格式,并保持實(shí)體信息原樣壓縮。內(nèi)容編碼后的實(shí)體由客戶端接收并負(fù)責(zé)解碼。

    • 壓縮并解碼.png

常用的內(nèi)容編碼有以下幾種

  • gzip(GNU zip)

  • compress (UNIX 系統(tǒng)的標(biāo)準(zhǔn)壓縮)

  • deflate (zlib)

  • identity (不進(jìn)行編碼)

  • 分割發(fā)送的分塊傳輸編碼

    • 分塊編碼傳輸.png

在HTTP通信過程中,請求的編碼實(shí)體在沒有全部傳輸完成之前,瀏覽器是無法顯示請求頁面的。所以在傳輸大量數(shù)據(jù)時(shí),通常會(huì)把數(shù)據(jù)分割成多塊。將這種技術(shù)稱為 分塊傳輸編碼。

使用分塊傳輸編碼的實(shí)體主體會(huì)由接收的客戶端負(fù)責(zé)解碼,恢復(fù)到編碼前的實(shí)體主體。

  • 發(fā)送多種數(shù)據(jù)的多部分對象集合

    發(fā)送郵件時(shí),我們可以在郵件里寫入文字并添加多發(fā)附件。這是因?yàn)椴捎昧薓IME(Multipurpose Internet Mail Extensions,多用途因特網(wǎng)郵件擴(kuò)展)機(jī)制,它允許郵件處理文本、圖片、視頻等多個(gè)不同類型的數(shù)據(jù)。

    HTTP協(xié)議中也采納了多部分對象集合,發(fā)送的一份報(bào)文主體內(nèi)可含多類型實(shí)體。通常是在圖片或文本文件等上傳時(shí)使用。

    多部分對象集合包含的對象如下:

    • multipart/form-data

      在Web表單文件上傳使用

    • multipart/byteranges

      狀態(tài)碼206響應(yīng)報(bào)文包含了多個(gè)范圍的內(nèi)容時(shí)使用。

    • multipart/form-data

      Content-Type: multipart/form-data; boundary=AaB03x
      --AaB03x
      Content-Disposition: form-data; name="field1"
      Joe Blow
      --AaB03x
      Content-Disposition: form-data; name="pics"; filename="file1.txt"
      Content-Type: text/plain
      ...(file1.txt的數(shù)據(jù))...
      --AaB03x--
      
    • multipart/byteranges

      HTTP/1.1 206 Partial Content
      Date: Fri, 13 Jul 2012 02:45:26 GMT
      Last-Modified: Fri, 31 Aug 2007 02:02:20 GMT
      Content-Type: multipart/byteranges; boundary=THIS_STRING_SEPARATES
      --THIS_STRING_SEPARATES
      Content-Type: application/pdf
      Content-Range: bytes 500-999/8000
      ...(范圍指定的數(shù)據(jù))...
      --THIS_STRING_SEPARATES
      Content-Type: application/pdf
      Content-Range: bytes 7000-7999/8000
      ...(范圍指定的數(shù)據(jù))...
      --THIS_STRING_SEPARATES--
      
  • 獲取部分內(nèi)容的范圍請求

    以前的用戶帶寬不夠,下載一個(gè)尺寸稍大的圖片或者文件就會(huì)很吃力。如果下載過程中遇到網(wǎng)絡(luò)問題中斷了下載,那么就需要從頭開始。為了解決上述問題,就產(chǎn)生了一種叫范圍請求的功能。

    對于一份10000字節(jié)大小的資源,如果使用范圍請求,可以只請求5001~10000字節(jié)內(nèi)的資源。

    • 范圍請求.png

執(zhí)行范圍請求時(shí),會(huì)用到首部字段Range來指定資源的byte范圍:

Range: bytes=5001-10000 // 5001-10000字節(jié)之間
Range: bytes=5001- // 從5001字節(jié)之后全部
Range: bytes=1-3000,5000-10000 // 多范圍指定

針對范圍請求,響應(yīng)會(huì)返回206狀態(tài)碼。對于多重范圍請求,響應(yīng)會(huì)在首部字段Content-Type表明multipart/byteranges后返回響應(yīng)報(bào)文

如果服務(wù)端無法響應(yīng)范圍請求,則會(huì)返回狀態(tài)碼200 OK然后返回完整的實(shí)體內(nèi)容。

github 歡迎Star,歡迎討論

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容