淘寶爬蟲 之 登陸驗證(一)

淘寶作為一大電商網(wǎng)站,反爬措施還是相當?shù)耐晟频?/p>

1-1

輸入賬號密碼,先別著急點擊登陸,需要準備一下;開發(fā)者模式找到網(wǎng)絡(luò),點擊持續(xù)更新日志,否則是找不到登陸頁面的

1-2

接下來點擊登陸,會發(fā)現(xiàn)login,里面就是我們需要的cookie了

1-3

找到Form Data,里面的數(shù)據(jù)就是我們需要的,全部都要

1-4

分析到此結(jié)束,下面直接上代碼

import requests

#淘寶登陸的url

url ="https://login.taobao.com/member/login.jhtml"

#記錄登陸狀態(tài)方便后續(xù)請求

ponse = requests.session()

headers = {

'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',

}

data = {

#在這里放入1-4 中的數(shù)據(jù)

}

#測試cookie是否驗證成功,可以換成淘寶其他的url

url1 ="https://s.taobao.com/search?q=%E9%94%AE%E7%9B%98&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306"

#記錄登陸請求狀態(tài)

ponse.post(url,headers=headers,data=data)

#后續(xù)請求

t = ponse.get(url1,headers=headers)

print(t.content.decode("utf8"))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容