http chunked編碼格式

http的響應(yīng)數(shù)據(jù)由下面2部分構(gòu)成:
響應(yīng)頭 + 數(shù)據(jù)部分
數(shù)據(jù)部分的格式由響應(yīng)頭說(shuō)明
一般情況下,HTTP的響應(yīng)頭包含Content-Length域來(lái)指明數(shù)據(jù)的長(zhǎng)度,例如:
有時(shí)候,服務(wù)器生成HTTP響應(yīng)時(shí),不好確定響應(yīng)數(shù)據(jù)的大小,可能是大文件的下載或后臺(tái)需要復(fù)雜的邏輯處理生成頁(yè)面,這樣一般就使用chunked編碼進(jìn)行傳輸。使用chunked編碼進(jìn)行傳輸不用事先說(shuō)明要傳輸?shù)捻?yè)面內(nèi)容的大小,通過(guò)一定的規(guī)則指明傳輸結(jié)束。

通常使用chunked編碼進(jìn)行傳輸?shù)臅r(shí)候,會(huì)先將數(shù)據(jù)進(jìn)行壓縮。HTTP響應(yīng)頭中的Content-Encoding域指明了壓縮格式。


當(dāng)數(shù)據(jù)很大的時(shí)候,還會(huì)分多個(gè)塊(chunk)傳輸。chunked編碼的格式如下:

注意chunk數(shù)據(jù)長(zhǎng)度的單位是字節(jié),不包括后面的\r\n。以一個(gè)長(zhǎng)度為0的塊作為結(jié)尾。
把所有的chunk數(shù)據(jù)部分組合起來(lái)存入文件,就是一個(gè)標(biāo)準(zhǔn)的gzip壓縮文件。

怎么樣把所有chunk數(shù)據(jù)部分提取出來(lái)呢?明白了上面的格式,其實(shí)就很簡(jiǎn)單了。
如果我們是通過(guò)TCP接收的數(shù)據(jù),首先要解決一個(gè)問(wèn)題:找到chunk數(shù)據(jù)開(kāi)始的地方,上面提到chunk前面是HTTP響應(yīng)頭。其它先不管,響應(yīng)頭是以連續(xù)的\r\n\r\n結(jié)尾的,這之后就是響應(yīng)的數(shù)據(jù)部分。
假設(shè)我們有一個(gè)buffer
char *m_contentData;
里面存儲(chǔ)著按序收到的所有響應(yīng)數(shù)據(jù)。
可以通過(guò)如下方式移動(dòng)到數(shù)據(jù)部分,即chunked數(shù)據(jù)開(kāi)始的地方(下圖所示:從A移動(dòng)到B)

 int n=0;
while(*m_contentData)
{
                 if (*m_contentData=='\r' || *m_contentData=='\n')
                                n++;
                 else
                                n=0;
                 if (n==4)
                                 break;
                m_contentData++;
}

定義char *m_gzipContentData保存gzip數(shù)據(jù),可以通過(guò)如下方式獲取到gzip數(shù)據(jù),然后寫(xiě)入文件。

 int len=0;
char ss[10];
char *p = m_contentData;
char *q = m_gzipData;
int gzip_len = 0;
while(1)
{
                sscanf(p, "%s", ss);
                 //read chunk-size
                len = HexToDecimal(ss); //convert hex to decimal
                 if (len == 0) //to chunk end
                                 break;
                p+=2; //read \r\n
                memcpy(q, p, len);
                q += len;
                p += len;
                gzip_len += len;
                p += 2; //read \r\n
}

fwrite(m_gzipData, 1, gzip_len, fp);
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容