爬蟲反爬:JS逆向之某d翻譯

1. 簡(jiǎn)介

快速優(yōu)雅地學(xué)會(huì)JS逆向,就需要從實(shí)戰(zhàn)開始,接下來(lái)我會(huì)提供Base64加密的原網(wǎng)址以及接口參數(shù),從實(shí)戰(zhàn)中學(xué)習(xí)如何下斷點(diǎn)、摳代碼、本地運(yùn)行等操作,此技術(shù)一般用于爬蟲上,是一個(gè)爬蟲程序猿進(jìn)階的必經(jīng)之路。

2. 實(shí)戰(zhàn)信息

網(wǎng)址:
aHR0cHM6Ly9mYW55aS5iYWlkdS5jb20vP2FsZHR5cGU9MTYwNDcjYXV0by96aA==
接口:
aHR0cHM6Ly9mYW55aS5iYWlkdS5jb20vdjJ0cmFuc2FwaT9mcm9tPXpoJnRvPWVu
逆向參數(shù):

  • sign:232427.485594
  • token:3dde9ef10b6f6ae310af38e6f1bd564f

3. 實(shí)戰(zhàn)流程

3.1 抓包找接口

首先,進(jìn)入頁(yè)面按F12,打開控制面板,調(diào)到Network板塊后在翻譯處寫入需要翻譯的信息(我這里輸入的是“你好”)觸發(fā)網(wǎng)絡(luò)請(qǐng)求,打開請(qǐng)求面板查看該請(qǐng)求的具體信息。

General

請(qǐng)求信息

  • URL:請(qǐng)求API地址
  • Method:請(qǐng)求方式GET/POST

Request headers

請(qǐng)求頭
除了自定義請(qǐng)求頭參數(shù),其余Host、Origin、Referer一般為爬蟲必須參數(shù),Cookie看站點(diǎn)是否有對(duì)其校驗(yàn),如果有特殊的自定義參數(shù)一般也為爬蟲需要。

  • Acs-Token:自定義的校驗(yàn)參數(shù)
  • Cookie:客戶端緩存信息
  • Host:域名
  • Origin:來(lái)源信息
  • Referer:防止跨站攻擊

3.2 查找加密參數(shù)

從上圖中可以看到sign和token有加密嫌疑,所以目標(biāo)就暫定為對(duì)這兩個(gè)參數(shù)進(jìn)行一個(gè)簡(jiǎn)單逆向。

3.3 斷點(diǎn)分類

下斷多種方法:

  1. 元素下斷
  2. 事件下斷
  3. XHR下斷
  4. 搜索下斷

3.4 學(xué)會(huì)快速下斷

這里主要展示XHR下斷和搜索下斷,在此比較好用。


XHR斷點(diǎn):首先復(fù)制請(qǐng)求鏈接?前的部分路徑,這里是/v2transapi,到Source下的XHR斷點(diǎn)處下斷,回車輸入新翻譯內(nèi)容即可觸發(fā)。

可以看到斷點(diǎn)斷在了send()方法的調(diào)用處,在Call stack中查看函數(shù)方法的調(diào)用棧,目前代碼可讀性太低,我們需要對(duì)其進(jìn)行格式化查看,就需要左下角的此按鈕。

格式化

在調(diào)用棧中查看自己所需參數(shù)的作用域,首先在調(diào)用棧中找到加密后的參數(shù)位置,然后往前推,直到找到加密的方法,此處直接展示尋找結(jié)果。

如上圖,作用域的位置就看提示的參數(shù)數(shù)據(jù)即可,windows下如果使用Chrome可以用ctrl鍵觸發(fā),這里查看的是ajax()的方法棧,同時(shí)我們可以找到加密后的結(jié)果,鼠標(biāo)放到函數(shù)參數(shù)里可以看到,我們也可以直接從Scope中查看然后返回源碼找。


此處左右兩側(cè)都可以看到一個(gè)加密后的sign和token數(shù)據(jù),就往前找調(diào)用的方法棧即可。

再往前一個(gè)方法棧就可以看到,headers里面必須有個(gè)"Acs-Token"的參數(shù),data中的數(shù)據(jù)來(lái)源是b,往上看b是一個(gè)對(duì)象,請(qǐng)求內(nèi)容在對(duì)象里,sign:x(n)|token:window.common.token這兩個(gè)參數(shù)是這樣獲取的。 我們可以直接知道x(n)就是sign的加密函數(shù),token存在window.common下。

鼠標(biāo)放置在x函數(shù)上會(huì)給一個(gè)跳轉(zhuǎn)提示,點(diǎn)擊index_61616b2.js有利于我們直接找到函數(shù)調(diào)用的方法,我們可以直接去摳代碼本地運(yùn)行,n鼠標(biāo)放上去可以發(fā)現(xiàn)就是"你好",將斷點(diǎn)打在8782行,重新鍵入更改斷點(diǎn)作用域。

測(cè)試確認(rèn)x(n)方法確實(shí)是sign獲取的方法位置,進(jìn)入函數(shù)。

image.png

此處可以直接摳到本地用Node運(yùn)行,代碼調(diào)用可以看到調(diào)用了兩個(gè)作用域里的函數(shù),所以對(duì)代碼摳全,進(jìn)行部分改寫,此處直接粘代碼。

function a(r) {
    if (Array.isArray(r)) {
        for (var o = 0, t = Array(r.length); o < r.length; o++)
            t[o] = r[o];
        return t
    }
    return Array.from(r)
}
function n(r, o) {
    for (var t = 0; t < o.length - 2; t += 3) {
        var a = o.charAt(t + 2);
        a = a >= "a" ? a.charCodeAt(0) - 87 : Number(a),
        a = "+" === o.charAt(t + 1) ? r >>> a : r << a,
        r = "+" === o.charAt(t) ? r + a & 4294967295 : r ^ a
    }
    return r
}
function e(r) {
    var o = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);
    if (null === o) {
        var t = r.length;
        t > 30 && (r = "" + r.substr(0, 10) + r.substr(Math.floor(t / 2) - 5, 10) + r.substr(-10, 10))
    } else {
        for (var e = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), C = 0, h = e.length, f = []; h > C; C++)
            "" !== e[C] && f.push.apply(f, a(e[C].split(""))),
            C !== h - 1 && f.push(o[C]);
        var g = f.length;
        g > 30 && (r = f.slice(0, 10).join("") + f.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join("") + f.slice(-10).join(""))
    }
    var u = void 0
      , l = "" + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);
    u = null !== i ? i : (i = window[l] || "") || "";
    for (var d = u.split("."), m = Number(d[0]) || 0, s = Number(d[1]) || 0, S = [], c = 0, v = 0; v < r.length; v++) {
        var A = r.charCodeAt(v);
        128 > A ? S[c++] = A : (2048 > A ? S[c++] = A >> 6 | 192 : (55296 === (64512 & A) && v + 1 < r.length && 56320 === (64512 & r.charCodeAt(v + 1)) ? (A = 65536 + ((1023 & A) << 10) + (1023 & r.charCodeAt(++v)),
        S[c++] = A >> 18 | 240,
        S[c++] = A >> 12 & 63 | 128) : S[c++] = A >> 12 | 224,
        S[c++] = A >> 6 & 63 | 128),
        S[c++] = 63 & A | 128)
    }
    for (var p = m, F = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), D = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + ("" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), b = 0; b < S.length; b++)
        p += S[b],
        p = n(p, F);
    return p = n(p, D),
    p ^= s,
    0 > p && (p = (2147483647 & p) + 2147483648),
    p %= 1e6,
    p.toString() + "." + (p ^ m)
}
console.log(e('你好'))

調(diào)試發(fā)現(xiàn)報(bào)錯(cuò)(命令行輸入node xx.js):


image.png

因?yàn)楸镜丨h(huán)境沒(méi)有window對(duì)象,因?yàn)閘是一步計(jì)算的到為固定值,我們需要獲取到window[l]的值,就先獲取l的值,鼠標(biāo)放在l上即可獲取因?yàn)榇怂惴楣潭ㄖ?,獲取到l = "gtk",所以此處的window[l] === window["gtk"],我們通過(guò)搜索ctrl+shift+f/Command+shift+f調(diào)出搜索面板,通過(guò)搜索(window["gtk"]|window['gtk']|window.gtk)這三個(gè)方法去查找,就看此處調(diào)用哪個(gè),某度翻譯用的window.gtk,是一個(gè)固定值。


image.png

直接摳值替換源碼里的window[l]即可,調(diào)試發(fā)現(xiàn)i還是undefined,所以在變量上定義一個(gè)i的初始化方法即可。
image.png

image.png

再次測(cè)試調(diào)用,對(duì)比瀏覽器請(qǐng)求參數(shù)。
image.png

結(jié)果一致就說(shuō)明獲取成功了,獲取到sign了還有個(gè)token值沒(méi)有獲取,這個(gè)又怎么獲取呢。上面我們發(fā)現(xiàn)是window.common.token產(chǎn)生,通過(guò)搜索(window["common"]|window['common']|window.common)先找父節(jié)點(diǎn)值,這里用window['common']即可搜到,發(fā)現(xiàn)common是頁(yè)面定義的變量,刷新頁(yè)面發(fā)現(xiàn)token值寫死我們這里就直接獲取到了token值。


image.png

image.png

4. JS完整代碼

var token = "3dde9ef10b6f6ae310af38e6f1bd564f"

function a(r) {
    if (Array.isArray(r)) {
        for (var o = 0, t = Array(r.length); o < r.length; o++)
            t[o] = r[o];
        return t
    }
    return Array.from(r)
}
function n(r, o) {
    for (var t = 0; t < o.length - 2; t += 3) {
        var a = o.charAt(t + 2);
        a = a >= "a" ? a.charCodeAt(0) - 87 : Number(a),
        a = "+" === o.charAt(t + 1) ? r >>> a : r << a,
        r = "+" === o.charAt(t) ? r + a & 4294967295 : r ^ a
    }
    return r
}
function e(r) {
    var o = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);
    if (null === o) {
        var t = r.length;
        t > 30 && (r = "" + r.substr(0, 10) + r.substr(Math.floor(t / 2) - 5, 10) + r.substr(-10, 10))
    } else {
        for (var e = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), C = 0, h = e.length, f = []; h > C; C++)
            "" !== e[C] && f.push.apply(f, a(e[C].split(""))),
            C !== h - 1 && f.push(o[C]);
        var g = f.length;
        g > 30 && (r = f.slice(0, 10).join("") + f.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join("") + f.slice(-10).join(""))
    }
    var u = void 0
    , l = "" + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);
    var i = null;
    u = null !== i ? i : (i = "320305.131321201" || "") || "";
    for (var d = u.split("."), m = Number(d[0]) || 0, s = Number(d[1]) || 0, S = [], c = 0, v = 0; v < r.length; v++) {
        var A = r.charCodeAt(v);
        128 > A ? S[c++] = A : (2048 > A ? S[c++] = A >> 6 | 192 : (55296 === (64512 & A) && v + 1 < r.length && 56320 === (64512 & r.charCodeAt(v + 1)) ? (A = 65536 + ((1023 & A) << 10) + (1023 & r.charCodeAt(++v)),
        S[c++] = A >> 18 | 240,
        S[c++] = A >> 12 & 63 | 128) : S[c++] = A >> 12 | 224,
        S[c++] = A >> 6 & 63 | 128),
        S[c++] = 63 & A | 128)
    }
    for (var p = m, F = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), D = "" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + ("" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), b = 0; b < S.length; b++)
        p += S[b],
        p = n(p, F);
    return p = n(p, D),
    p ^= s,
    0 > p && (p = (2147483647 & p) + 2147483648),
    p %= 1e6,
    p.toString() + "." + (p ^ m)
}
// console.log(e('你好'))
// console.log(token)

// 獲取Sign
function getSign(str){
    return e(str)
}
// 獲取Token
function getToken(){
    return token
}
// Node導(dǎo)出方法方式
module.exports = {
    getSign,
    getToken
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容