Requests 模塊的基本使用

1.我們?yōu)槭裁粗攸c(diǎn)學(xué)習(xí)使用requests模塊,而不是urllib

1.requests的底層實(shí)現(xiàn)就是urllib

2.requests在python2 和 python3 中通用,方法完全一樣

3.requests 簡(jiǎn)單易用

4.requests 能夠自動(dòng)幫助我們解壓(gizp壓縮的等)網(wǎng)頁(yè)內(nèi)容

2.requests 的作用

發(fā)送網(wǎng)絡(luò)請(qǐng)求,返回響應(yīng)數(shù)據(jù)

3.requests 模塊發(fā)送簡(jiǎn)單的請(qǐng)求,獲取響應(yīng)

需求:通過(guò)requests 向百度首頁(yè)發(fā)送請(qǐng)求,獲取百度首頁(yè)的數(shù)據(jù);

response = request.get(url)

response 的常用屬性

- response.text

- response.stantus_code

- response.request.headers

- response.headers

3.1 response.text 和 response.content 的區(qū)別

response.text

- 類型:str

- 解碼類型: 根據(jù)HTTP 頭部對(duì)響應(yīng)的編碼作出有根據(jù)的推測(cè),推測(cè)的文本編碼

- 如何修改編碼方式:response.encoding=”gbk”

response.content

- 類型:bytes

- 解碼類型: 沒(méi)有指定

- 如何修改編碼方式:response.content.deocde(“utf8”)

獲取網(wǎng)頁(yè)源碼的通用方式:

response.content.decode()

response.content.decode("GBK")

response.text


4.發(fā)送帶header的請(qǐng)求

帶上 headers 的作用:

模擬瀏覽器,欺騙服務(wù)器,獲取和瀏覽器一致的內(nèi)容

header的形式:字典

headers ={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}

用法

requests.get(url,headers=headers)

5.發(fā)送帶參數(shù)的請(qǐng)求

例如:https://www.baidu.com/s?wd=python&c=b

參數(shù)的形式:字典

kw = {'wd':'橘子'}

用法

requests.get(url,params=kw)

注意點(diǎn)

在url地址中,很多參數(shù)是沒(méi)有用的,比如百度搜索的url地址,其中參數(shù)只有一個(gè)字段有用,其他的都可以刪除

對(duì)應(yīng)的,在后續(xù)的爬蟲(chóng)中,越到很多參數(shù)的url地址,都可以嘗試刪除參數(shù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 上一篇:8.Urllib庫(kù)基本使用下一篇:10.正則表達(dá)式基礎(chǔ) requests是python實(shí)現(xiàn)的最簡(jiǎn)單易用的H...
    在努力中閱讀 3,613評(píng)論 2 11
  • Requests快速上手 迫不及待了嗎?本頁(yè)內(nèi)容為如何入門(mén) Requests 提供了很好的指引。其假設(shè)你已經(jīng)安裝了...
    小娟_bb93閱讀 1,531評(píng)論 0 3
  • Getting Started Burp Suite 是用于攻擊web 應(yīng)用程序的集成平臺(tái)。它包含了許多工具,并為...
    Eva_chenx閱讀 29,250評(píng)論 0 14
  • 【打卡始于20180318持續(xù)打卡于20190503 姓名:富智燚 單位:海南蔚藍(lán)時(shí)代實(shí)業(yè)有限公司 361期努力一...
    復(fù)制2閱讀 130評(píng)論 0 0
  • 每天都是輪回,都為生活、工作、賺錢所紛擾,就像上學(xué)時(shí)一樣,天天就是作業(yè)、卷子,煩,總想著畢業(yè)就好了,想干嘛就干嘛,...
    sunny_25e0閱讀 112評(píng)論 0 0

友情鏈接更多精彩內(nèi)容