四種常見(jiàn)的POST提交方式的區(qū)別

??前言:最近在寫一個(gè)網(wǎng)站的爬蟲(chóng)的時(shí)候模擬了一個(gè)請(qǐng)求卻老是得到httpcode 400這個(gè)響應(yīng),大家也知道一般這個(gè)響應(yīng)主要是因?yàn)榭蛻舳艘簿褪前l(fā)送方的接口請(qǐng)求格式有問(wèn)題,一開(kāi)始我直接使用Postman去模擬請(qǐng)求,是可以得到數(shù)據(jù)的,然后我又使用python腳本去模擬請(qǐng)求,卻始終得不到,后來(lái)結(jié)合之前開(kāi)發(fā)服務(wù)端的經(jīng)驗(yàn),發(fā)現(xiàn)犯了一個(gè)很初級(jí)的錯(cuò)誤,沒(méi)有注意到content-type的提交POST的方式,難怪一直出錯(cuò),下面我們來(lái)還原一下場(chǎng)景,以及擴(kuò)展分析一下四種常見(jiàn)的POST提交方式的區(qū)別。

演示:

??我們需要爬的網(wǎng)站模擬的請(qǐng)求如下:


content-type
form data

??因?yàn)閷憫T了content-typeapplication/json的格式了,所以習(xí)以為常的把form-data寫成了Python中的dict格式,結(jié)果一直報(bào)400的錯(cuò)誤,錯(cuò)誤代碼大致如下:

import requests
headers = {
  "content-type": "application/x-www-form-urlencoded;charset=UTF-8"
}
data = {
  "f.req": xxx,
  "at": xxx
}
requests.post(url=url,headers=headers,data=data)

??之后結(jié)合之前做服務(wù)端的時(shí)候經(jīng)常被這個(gè)content-type搞懵逼的經(jīng)歷,就看出請(qǐng)求方式的錯(cuò)誤,于是把代碼改成了這樣,就完美的收到200的響應(yīng)了。

import requests
from urllib.parse import urlencode

headers = {
  "content-type": "application/x-www-form-urlencoded;charset=UTF-8"
}
data = {
  "f.req": xxx,
  "at": xxx
}
data = urlencode(data)
requests.post(url=url,headers=headers,data=data)

擴(kuò)展:

  • application/x-www-form-urlencoded
  • multipart/form-data
  • application/json
  • text/xml
    以上是四種常見(jiàn)的POST提交數(shù)據(jù)的方式,我們知道,HTTP 協(xié)議是以 ASCII 碼傳輸(可參考http介紹),建立在 TCP/IP 協(xié)議之上的應(yīng)用層規(guī)范。規(guī)范把 HTTP 請(qǐng)求分為三個(gè)部分:狀態(tài)行、請(qǐng)求頭消息主體。類似于下面這樣
<method> <request-URL> <version>
<headers>
<entity-body>

議規(guī)定 POST 提交的數(shù)據(jù)必須放在消息主體(entity-body)中,但協(xié)議并沒(méi)有規(guī)定數(shù)據(jù)必須使用什么編碼方式。實(shí)際上,開(kāi)發(fā)者完全可以自己決定消息主體的格式,只要最后發(fā)送的 HTTP 請(qǐng)求滿足上面的格式就可以。

但是,數(shù)據(jù)發(fā)送出去,還要服務(wù)端解析成功才有意義。一般服務(wù)端語(yǔ)言如 php、python 等,以及它們的 framework,都內(nèi)置了自動(dòng)解析常見(jiàn)數(shù)據(jù)格式的功能。服務(wù)端通常是根據(jù)請(qǐng)求頭(headers)中的 Content-Type 字段來(lái)獲知請(qǐng)求中的消息主體是用何種方式編碼,再對(duì)主體進(jìn)行解析。所以說(shuō)到 POST 提交數(shù)據(jù)方案,包含了 Content-Type消息主體編碼方式兩部分。下面就正式開(kāi)始介紹它們。

1.application/x-www-form-urlencoded

??這應(yīng)該是最常見(jiàn)的 POST提交數(shù)據(jù)的方式了。瀏覽器的原生form 表單,如果不設(shè)置enctype屬性,那么最終就會(huì)以 application/x-www-form-urlencoded 方式提交數(shù)據(jù)。請(qǐng)求類似于下面這樣(無(wú)關(guān)的請(qǐng)求頭在本文中都省略掉了):

POST http://www.example.com HTTP/1.1
Content-Type: application/x-www-form-urlencoded;charset=utf-8
title=test&sub%5B%5D=1&sub%5B%5D=2&sub%5B%5D=3

??首先,Content-Type 被指定為application/x-www-form-urlencoded;其次,提交的數(shù)據(jù)按照 key1=val1&key2=val2 的方式進(jìn)行編碼,key 和 val 都進(jìn)行了 URL 轉(zhuǎn)碼。大部分服務(wù)端語(yǔ)言都對(duì)這種方式有很好的支持。很多時(shí)候,我們用 Ajax提交數(shù)據(jù)時(shí),也是使用這種方式。例如 JQueryQWrap 的 Ajax,Content-Type 默認(rèn)值都是「application/x-www-form-urlencoded;charset=utf-8」。

2.multipart/form-data

??這又是一個(gè)常見(jiàn)的 POST數(shù)據(jù)提交的方式。我們使用表單上傳文件時(shí),必須讓 formenctyped 等于這個(gè)值。直接來(lái)看一個(gè)請(qǐng)求示例:

POST http://www.example.com HTTP/1.1
Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="text"
title
------WebKitFormBoundaryrGKCBY7qhFd3TrwA
Content-Disposition: form-data; name="file"; filename="chrome.png"
Content-Type: image/png
PNG ... content of chrome.png ...
------WebKitFormBoundaryrGKCBY7qhFd3TrwA--

??這個(gè)例子稍微復(fù)雜點(diǎn)。首先生成了一個(gè) boundary用于分割不同的字段,為了避免與正文內(nèi)容重復(fù),boundary 很長(zhǎng)很復(fù)雜。然后 Content-Type里指明了數(shù)據(jù)是以 mutipart/form-data 來(lái)編碼,本次請(qǐng)求的boundary 是什么內(nèi)容。消息主體里按照字段個(gè)數(shù)又分為多個(gè)結(jié)構(gòu)類似的部分,每部分都是以–boundary 開(kāi)始,緊接著內(nèi)容描述信息,然后是回車,最后是字段具體內(nèi)容(文本或二進(jìn)制)。如果傳輸?shù)氖俏募?,還要包含文件名和文件類型信息。消息主體最后以 –boundary–標(biāo)示結(jié)束。關(guān)于 mutipart/form-data 的詳細(xì)定義,請(qǐng)前往 rfc1867 查看。這種方式一般用來(lái)上傳文件,各大服務(wù)端語(yǔ)言對(duì)它也有著良好的支持。上面提到的這兩種POST 數(shù)據(jù)的方式,都是瀏覽器原生支持的,而且現(xiàn)階段原生 form 表單也只支持這兩種方式。但是隨著越來(lái)越多的 Web 站點(diǎn),尤其是 WebApp,全部使用 Ajax進(jìn)行數(shù)據(jù)交互之后,我們完全可以定義新的數(shù)據(jù)提交方式,給開(kāi)發(fā)帶來(lái)更多便利。

3.application/json

??application/json 這個(gè) Content-Type作為響應(yīng)頭大家肯定不陌生。實(shí)際上,現(xiàn)在越來(lái)越多的人把它作為請(qǐng)求頭,用來(lái)告訴服務(wù)端消息主體是序列化后的 JSON 字符串。由于 JSON規(guī)范的流行,除了低版本 IE 之外的各大瀏覽器都原生支持 JSON.stringify,服務(wù)端語(yǔ)言也都有處理 JSON 的函數(shù),使用JSON不會(huì)遇上什么麻煩。
??JSON格式支持比鍵值對(duì)復(fù)雜得多的結(jié)構(gòu)化數(shù)據(jù),這一點(diǎn)也很有用。

POST http://www.example.com HTTP/1.1
Content-Type: application/json;charset=utf-8
{"title":"test","sub":[1,2,3]}

??這種方案,可以方便的提交復(fù)雜的結(jié)構(gòu)化數(shù)據(jù),特別適合RESTful的接口。各大抓包工具如Chrome 自帶的開(kāi)發(fā)者工具、Firebug、Fiddler,都會(huì)以樹(shù)形結(jié)構(gòu)展示 JSON數(shù)據(jù),非常友好。

4.text/xml

??它是一種使用 HTTP作為傳輸協(xié)議,XML 作為編碼方式的遠(yuǎn)程調(diào)用規(guī)范。典型的XML-RPC請(qǐng)求是這樣的:

POST http://www.example.com HTTP/1.1
Content-Type: text/xml
<?xml version="1.0"?>
<methodCall>
    <methodName>examples.getStateName</methodName>
    <params>
        <param>
            <value><i4>41</i4></value>
        </param>
    </params>
</methodCall>

??XML-RPC 協(xié)議簡(jiǎn)單、功能夠用,各種語(yǔ)言的實(shí)現(xiàn)都有。比如微信的小程序公眾平臺(tái)都是使用它來(lái)作為基本的傳輸類型,它的使用也很廣泛,如 WordPressXML-RPC Api,搜索引擎的 ping 服務(wù)等等。JavaScript 中,也有現(xiàn)成的庫(kù)支持以這種方式進(jìn)行數(shù)據(jù)交互,能很好的支持已有的 XML-RPC服務(wù)。不過(guò),我個(gè)人覺(jué)得XML 結(jié)構(gòu)還是過(guò)于臃腫,一般場(chǎng)景用 JSON會(huì)更靈活方便。

總結(jié):

??以上就是關(guān)于四種POST提交數(shù)據(jù)的方式的不同了,大家可以仔細(xì)結(jié)合參考資料好好領(lǐng)會(huì)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容