python3模擬知乎登錄

代碼github地址:zhihu

首先分析知乎登錄頁,一般模擬登錄走的都是手機(jī)頁,比較方便

分析登錄過程

為了得到驗證碼我特意都輸錯了幾次密碼,知乎的登錄不一定有驗證碼,所以我們在代碼實現(xiàn)的過程中需要做判斷是否需要驗證碼

引入依賴:

from urllib import request,parse
from bs4 import BeautifulSoup
import http.cookiejar 
import json
import random
import time
import configparser

構(gòu)建全局請求頭

因為要模擬手機(jī),所以這里我們用的是手機(jī)的user-Agent

def build_opener():
    cookie = http.cookiejar.CookieJar()
    cookie_processor = request.HTTPCookieProcessor(cookie)
    opener = request.build_opener(cookie_processor) 
    opener.addheaders = [("User-Agent", "Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1"),
    ("Referer", "https://www.zhihu.com/"),
    ("Origin", "https://www.zhihu.com/"),
    ("Host", "www.zhihu.com")]
    request.install_opener(opener)

登錄過程

def login(code=0):
    login_data = configparser.ConfigParser()
    login_data.read("user.ini") #將用戶名密碼放在user.ini配置文件

    username = login_data.get("LoginInfo", "email")
    password = login_data.get("LoginInfo", "password")
    url = 'https://www.zhihu.com/signin'
    login_url = 'https://www.zhihu.com/login/email'
    captcha_url = 'https://www.zhihu.com/captcha.gif'
    req = request.Request(url)
    res = request.urlopen(req)

    html = res.read().decode('utf-8')
    soup = BeautifulSoup(html)
    inputs = soup.find_all('input')

    _xsrf = inputs[0]['value']


    # 構(gòu)造登錄參數(shù)
    params = {
        'email': username,
        'password': password,
        '_xsrf': _xsrf
    }

    #如果code是1,說明需要驗證碼,讀取驗證碼并寫入到本地,然后手動輸入驗證碼
    if code == 1:
        cap_parms = parse.urlencode({"r": time.time(), "type": "login"}).encode('utf-8')
        captcha_req = request.Request(captcha_url,cap_parms,method="GET")
        captcha_res = request.urlopen(captcha_req)
        fo = open('captcha.jpg','wb+')
        fo.write(captcha_res.read())
        fo.close()
        captcha = input("請輸入驗證碼:\n")
        params['captcha'] = captcha

    params = parse.urlencode(params).encode('utf-8')

    req = request.Request(login_url,params,method="POST")
    res = request.urlopen(req)
    
    result = res.read().decode('utf-8')
    login_result = json.loads(result)


    if login_result['r'] == 0:
        print('登陸成功')
    else:
        if login_result['errcode'] == 1991829: 
            login(1)
        else:
            print(login_result['msg'])
            login()

最后

if __name__ == '__main__':
    build_opener()
    login()

實例效果

zhihu.gif

代碼地址:https://github.com/vincenth520/Spider/tree/master/zhihu

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,082評論 25 709
  • 下雨后,天氣一直不陰不晴的。我不知道怎么去形容這種天氣,只能說是欣賞不動。一直愛的就是艷陽天吧,熾熱熱烈。 天井里...
    童話結(jié)CX閱讀 327評論 2 2
  • 有一條路,最近7年幾乎每天都在那里走過,我再熟悉不過。走在人行路上,我感到無比安全。路長幾百米,短得可憐。 然而當(dāng)...
    我不是注銷了嗎閱讀 292評論 0 0
  • 戰(zhàn)報記者:飯團(tuán) 北京時間12月11日上午10時,2016至2017賽季巾幗杯管院與工火小組賽在圣伊斯特坎帕斯展開。...
    GYNZ閱讀 392評論 0 0
  • 如果說從小到大有哪幾件事是他特別想做的,那么這就是其中之一。 沒有為什么!只為那心中的狂熱,遇見沿途...
    Jack野小子閱讀 394評論 6 5

友情鏈接更多精彩內(nèi)容