方案(一)
不停變換user-agent, 但很快就被封了.
方案(二)
使用瀏覽器訪問豆瓣, 將cookies拷貝下來交給爬蟲使用, 不過也就大概一分鐘左右, 這個cookies就被封掉了, 而且換IP也沒法.
方案(三)
利用requests庫自帶的session, 用一個新的session去訪問豆瓣, 這樣豆瓣會頒發(fā)一個cookies, 帶著這個cookies(requests庫自動管理cookies)去訪問豆瓣, 一段時間后, 這個session會被豆瓣封掉, 這時換一個新的session就行了.
不過, 還是被封了, 猜測是豆瓣檢測到這個IP有太多的新用戶, 不再為新的用戶頒發(fā)cookies了
方案(四)
分析出cookies的規(guī)律, 自己偽造, 豆瓣居然沒檢查, 爬完收工.
戰(zhàn)果很豐富! (__)