2019-07-15

當(dāng)你寫爬蟲遇到APP的請(qǐng)求有加密參數(shù)時(shí)該怎么辦?【初級(jí)篇-常規(guī)模式】

嗯,在看完了《當(dāng)你寫爬蟲抓不到APP請(qǐng)求包的時(shí)候該怎么辦?》系列之后,同學(xué)們對(duì)抓APP的請(qǐng)求包應(yīng)該已經(jīng)是輕車熟路了吧。在對(duì)想爬的APP抓個(gè)包之后你可能會(huì)發(fā)現(xiàn),只是抓到包似乎沒有什么卵用啊,凡是有用的接口基本都有一個(gè)或多個(gè)加密的參數(shù),而且它還每次請(qǐng)求都變,而自己去請(qǐng)求對(duì)應(yīng)的接口時(shí),如果沒帶或者隨便輸入一串值給這種參數(shù),還會(huì)出現(xiàn)不返回?cái)?shù)據(jù)的情況,這可怎么辦才好?

別擔(dān)心,據(jù)我觀察,目前至少80%左右的常見APP(BAT這類大廠的除外)在安全方面做的并不好,在看完這篇文章之后,你將知道如何輕松地拿下它們。

我們直接開始實(shí)戰(zhàn)演練吧,這里我寫了一個(gè)演示用的APP給你玩,它會(huì)像我前面所說的一樣,發(fā)出一個(gè)請(qǐng)求并帶有一個(gè)加密參數(shù)——sign,且每次請(qǐng)求時(shí)sign都會(huì)變化。

APP啟動(dòng)界面

安裝之后打開它,并準(zhǔn)備好你的抓包工具,然后點(diǎn)擊“點(diǎn)擊發(fā)送請(qǐng)求”按鈕。

請(qǐng)求完畢

不出意外的話會(huì)出現(xiàn)一個(gè)“sign校驗(yàn)通過”的提示,然后我們看看抓到的包吧。

抓包結(jié)果

從抓包工具中我們可以很明顯地看出來,會(huì)變動(dòng)的參數(shù)有兩個(gè),一個(gè)是ts,一個(gè)是sign。(為了看到變化建議多發(fā)兩個(gè)請(qǐng)求對(duì)比)

先分析一下參數(shù)的含義吧,ts從名字上可以看出來,應(yīng)該是個(gè)時(shí)間戳,實(shí)際將ts的值格式化一下也可以確定這就是個(gè)請(qǐng)求時(shí)的時(shí)間戳;然后是sign,一眼看上去大概32位左右,而外觀長(zhǎng)這樣的一般是hash,猜測(cè)一下最有可能性的是md5之類的,但不知道實(shí)際是如何生成的,只能逆向看看了。

該正式開始破解這個(gè)加密參數(shù)了,由于Android APP是靜態(tài)編譯的,不像JS,直接可以看到源碼,所以...我們需要對(duì)APP進(jìn)行反編譯,這里我使用的工具名為Jadx,前面的《寫APP爬蟲會(huì)需要用到哪些工具呢?》和《當(dāng)你寫爬蟲抓不到APP請(qǐng)求包的時(shí)候該怎么辦?【高級(jí)篇-混淆導(dǎo)致通用Hook工具失效】》文章中也有提到,這里就不再贅述了。

使用jadx反編譯APK

反編譯之后可以看到這么一堆亂七八糟的的東西,那么我們要怎么找到生成sign參數(shù)的地方呢?

看到那個(gè)像魔法棒一樣的按鈕了嗎?點(diǎn)一下它。

jadx搜索文本

然后它會(huì)彈出一個(gè)“搜索文本”的窗口,接著我們有兩種方式快速定位到生成的位置:

搜索URL的路徑部分

路徑部分指的是/learning/hash_sign這一段,當(dāng)然有些APP為了復(fù)用可能會(huì)將路徑拆分成多段的,如果直接搜索完整路徑搜索不到的話可以嘗試以反斜杠為分隔符,將路徑拆分成多個(gè)來搜(記得從右往左搜,別問為什么),這里的話我們直接搜索hash_sign即可,因?yàn)檫@個(gè)名字很獨(dú)特,一般應(yīng)該不會(huì)出現(xiàn)有其他不相關(guān)的東西也叫這個(gè)名字的情況。

一搜就能定位到請(qǐng)求的位置了~

通過搜索路徑方式定位

搜索你要找的參數(shù)

比如這里我們需要找的是sign這個(gè)參數(shù),可以直接搜索"sign"(注意帶上雙引號(hào)),但如果結(jié)果很多,而且還都很像生成/設(shè)置sign的地方的話,可以搜一些別的比較獨(dú)特的參數(shù),比如這里出現(xiàn)的model、brand之類的在代碼中一般不會(huì)經(jīng)常出現(xiàn)的詞。

由于這個(gè)DEMO APP比較簡(jiǎn)單,所以直接搜索"sign"就能定位到設(shè)置值的位置了~

通過搜索參數(shù)名方式定位

定位到了代碼位置之后我們就可以開始看代碼了,從搜到的結(jié)果中我們可以看到生成sign、設(shè)置sign、設(shè)置路徑的代碼都在這個(gè)l方法下,然后我們來從設(shè)置sign的位置開始從下往上分析,這樣代碼的邏輯會(huì)更容易看懂一些。

定位到的代碼

這里我將代碼中的關(guān)鍵點(diǎn)都做了標(biāo)記,你可以按著旁邊標(biāo)注的序號(hào)跟著我一起來看這個(gè)代碼。

首先這個(gè)aVar4.a有兩個(gè)地方出現(xiàn)了,但是傳入的第二個(gè)參數(shù)都是stringBuilder2,而下面那里是直接設(shè)置了一個(gè)空值進(jìn)去,顯然不是我們想要找的,所以我們可以忽略掉下面的那一行帶有sign關(guān)鍵詞的代碼,直接看標(biāo)注了1的那一行。

image

選中stringBuilder2這個(gè)變量,可以看到它的值是從上面那個(gè)stringBuilder3.toString()得到的,接著看看stringBuilder3的生成,for循環(huán)這里做了什么操作看不懂,但是可以看到上面有個(gè)很顯眼的字符串"MD5"。那么我們可以大膽地猜測(cè)一下,這個(gè)stringBuilder3實(shí)際上就是做了個(gè)MD5操作而已,與我們最開始抓包時(shí)的猜測(cè)相同,直接往上看看Hash前的字符串長(zhǎng)啥樣,然后測(cè)試一下吧,不行的話再回來看。

image

從前面MD5操作的位置可以看到digest方法里用到的參數(shù)又是一個(gè)叫做stringBuilder2的變量,繼續(xù)往上看就能看到實(shí)際上是從stringBuilder.toString()那得到的,那么這個(gè)stringBuilder又是怎么來的呢?從代碼中我們可以看出似乎是for一個(gè)TreeMap然后把每一個(gè)key和value組成key=value的格式寫入stringBuilder中,如果stringBuilder里已經(jīng)有值的話還會(huì)添加&符號(hào),那么這最終出來的東西可以聯(lián)想到的是什么?對(duì)!就是queryString那部分,只不過它的參數(shù)是被排過序的(因?yàn)門reeMap會(huì)自動(dòng)進(jìn)行排序)。

image

然后我們?cè)偻厦婵矗?yàn)證一下想法正不正確,可以看到最源頭的地方是個(gè)HashMap,被put進(jìn)去的都是我們抓包時(shí)看到的參數(shù)。

現(xiàn)在我們就把這個(gè)sign的生成邏輯給理清楚了,其實(shí)它就是個(gè)按照參數(shù)名排過序的queryString進(jìn)行了一次MD5操作后的產(chǎn)物,接下來我們只需要在代碼中實(shí)現(xiàn)這個(gè)生成邏輯就行了,在Python中,你可以使用它自帶的官方庫hashlib來對(duì)一個(gè)字符串做MD5操作。

image

那么我們寫一段代碼模擬請(qǐng)求一下試試,sign確實(shí)可以通過校驗(yàn),說明我們生成的sign是可以使用的,至此,加密參數(shù)破解完成。

提示:建議實(shí)際操作中不要這么測(cè)試,容易觸發(fā)反爬??梢韵饶米グ玫降膮?shù)生成一遍對(duì)比一下,如果一樣則說明生成的sign沒有問題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 聽說這個(gè)爬蟲面試題很難?看完你就知道怎么做了 最近有一個(gè)爬蟲面試題(http://shaoq.com:7777/e...
    FrankYang3110閱讀 286評(píng)論 0 0
  • 當(dāng)你寫爬蟲抓不到APP請(qǐng)求包的時(shí)候該怎么辦?【高級(jí)篇-混淆導(dǎo)致通用Hook工具失效】 提示:因?yàn)楦呒?jí)篇以后的APP...
    FrankYang3110閱讀 271評(píng)論 0 0
  • 當(dāng)你寫爬蟲時(shí)遇上Flash+加密的解決方式 今天在摸魚逛V2EX的時(shí)候,有個(gè)帖子引起了我的注意 帖子內(nèi)容: 視頻鏈...
    FrankYang3110閱讀 542評(píng)論 0 0
  • 作者:iOS開發(fā)工程師 伊澤瑞爾 目前,移動(dòng)開發(fā)技術(shù)主要分為原生開發(fā)和跨平臺(tái)開發(fā)兩種。其中,原生應(yīng)用是指在某個(gè)特...
    李紹俊閱讀 716評(píng)論 0 0
  • 服務(wù)注冊(cè)與服務(wù)發(fā)現(xiàn)是在分布式服務(wù)架構(gòu)中常常會(huì)涉及到的東西,業(yè)界常用的服務(wù)注冊(cè)與服務(wù)發(fā)現(xiàn)工具有 ZooKeeper[...
    叫我峰兄閱讀 648評(píng)論 0 0

友情鏈接更多精彩內(nèi)容