爬取《餓了嗎》《美團》《京東到家》店家地址及菜品

  首先是《餓了嗎》 最簡單沒有做任何防護 ,直接模擬器加fiddler得到請求然后用postman做分析 可以發(fā)現(xiàn)根本沒有任何加密參數(shù) 直接偽造請求用代理進行爬取 

然后是《美團》 兩次加密 +假數(shù)據(jù)+封ip+流量限制 別問我是怎么知道的 其中滋味 自己體會
簡單說說第一層加密是用的RSA加密 (java層面)可以通過分析代碼進行還原 第二次就是后面的幾個(字段上面有_的)在so里面 因為本人不是安全專業(yè)出生的所以還原不出來
用的方法就是 字段全隨機 然后用這兩個加密數(shù)據(jù)進行加密然后請求出去可以請求到數(shù)據(jù)
但是他會返回假數(shù)據(jù)也會返回真數(shù)據(jù)然后會一直報403 寫出了一套方案爬了半天 數(shù)據(jù)少 而且因為他有一個加密方式我不知道怎么破解,所以我用的是模擬器的方式 但是模擬器反應慢 所以根本不行
那怎么辦呢 不慌 美團還有一個網頁的外賣網站相信大家都懂了吧 然后需要注意的request 里面cookie會出不來 建議用fiddler抓包然后 你就可以找到你需要請求了 因為我這邊需要的數(shù)據(jù)他剛剛好沒有進行字段加密所以很快的就拿完了
最后是《京東到家》先說下他的限制吧 反hook+字段加密 單單是反hook這一點相信就可以勸退很多人了吧 在加上他有幾個字段都是加密字段 短時間很難搞定 然后想的辦法就是從《京東》上面找入口 進入京東到家 但是你會發(fā)現(xiàn)根本進不去 閃退 最后我用以前的老版本發(fā)現(xiàn)可以進去單是只能進去一次而且動作一定要快 我發(fā)現(xiàn)我要的數(shù)據(jù)完全沒有加密隨便改字段都行
以上就是三個app的 爬取過程 終結一下 《餓了嗎》 一坨翔 《美團》就是鐵桶陣 《京東到家》如果不是僥幸發(fā)現(xiàn)老版本 簡直是噩夢(我是寫代碼的但是不是專業(yè)搞爬蟲的) 所以不對之處還請各位前輩不吝賜教!?。。。。?!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 在簡書寫作一年了,得到的只是微少的贊賞,可幾乎沒有被分享過,那些自稱寫幾個月就能月入過萬的要么是天才,要么就是另有...
    泓清5368閱讀 188評論 0 0
  • 不知道從什么時候開始,我就患上了深夜焦慮癥。所謂的深夜焦慮癥,就是每當夜深人靜的時候就焦慮的睡不著。 每當睡不著的...
    月兒的月光閱讀 1,535評論 0 4
  • What's your favorite sport? Actually, my favorite sport i...
    AsaGuo閱讀 780評論 0 0
  • 曾經有一位朋友給我分享過一句話,是他在交大讀博士的時候,他們醫(yī)院的一位院士語重心長告訴他的:怎么當一個醫(yī)術高明的醫(yī)...
    a6c418dc3e29閱讀 2,154評論 0 1

友情鏈接更多精彩內容