android逆向之Dalvik指令集

前言

Dalvik指令語法詳解
該篇文章為本人的學(xué)習(xí)筆記,如有不對之處,請指教.

附參考鏈接:smali文件語法參考

類型

字節(jié)碼類型描述符

語法 含義
V void,只用于返回值類型
Z boolean
B byte
S short
C char
I int
J long
F float
D double
L java類類型
[ 數(shù)組類型

其中L類型可以表示Java類型中的任何類.
例如

      java.lang.String  
在smali語法中表示為:
      Ljava.lang.String;

注意后面有個分號,L類型最后的分號表示對象名結(jié)束.

[類型可以表示所有基本類型的數(shù)組. [后面緊跟基本數(shù)據(jù)類型描述符. 如[I 相當(dāng)于Java中的int[],即一維數(shù)組. [[I相當(dāng)于Java中的int[][],即二維數(shù)組.
三維、四維等等數(shù)值以此類推. 注意多維數(shù)組的維數(shù)最大為255個.

L[ 可以同時使用用來表示對象數(shù)組. 如[Ljava.lang.String;就表示這是一個String類型的數(shù)組.

方法及字段

方法的表現(xiàn)格式如下

Lpackage/name/ObjectName;->MethodName(III)Z

其中 Lpackage/name/ObjectName;應(yīng)該理解為該方法所在的類,MethodName為具體方法名,(III)Z 這是方法具體的傳參和返回部分,其中括號內(nèi)的III為方法參數(shù)(在這里是表示三個int類型的參數(shù)),Z表示方法多維返回值(在這里返回值為boolean類型).

字段的格式和方法很像,只是方法的括號、括號里面的參數(shù)及返回值,這些字段都是沒有的,后面取而代之的是字段自己的類型.字段格式如下

Lpackage/name/ObjectName;->FieldName:Ljava/lang/String;

其中Lpackage/name/ObjectName;不用說還是該字段所在的類,FieldName為字段名,Ljava/lang/String;為字段類型.其中字段名與字段類型之間用冒號:隔開.

Dalvik指令

首先咱們來解析一條指令

move-wide/from16 vAA,vBBBB

move為基礎(chǔ)字節(jié)碼,即操作符 . wide為名稱后綴,標(biāo)識操作的數(shù)組為64位. from16位字節(jié)碼的后綴,標(biāo)識源操作數(shù)是一個16位寄存器引用變量. vAA為目的寄存器,他始終在源寄存器的前面.
vBBBB為源寄存器. 若沒有wide后綴,默認(rèn)為32位.

move指令

move 指令的作用是將源寄存器的值賦值給目的寄存器,即

move vA,vB

move-wide作用同上,只是賦值的為64位.</br> move-object是為對象賦值.
move-result 指令的作用是將上一個invoke類型指令的操作結(jié)果賦值給目的寄存器,即

move-result vAA

move-result-wide作用同上,只是賦值的為64位. </br> move-object同上,只是賦值為對象類型.

返回指令

return-void表示函數(shù)從一個void方法返回.
return 表示函數(shù)返回一個32位非對象的值.
return-wide 表示函數(shù)返回一個64位非對象的值.
return-object 表示函數(shù)返回一個對象類型.

數(shù)據(jù)定義

const常用來定義程序中用到是常量、字符串、類等數(shù)據(jù).</br> const 、const/4、const/16給寄存器賦值基本數(shù)據(jù)類型.即

const/4 v1, 0x2

當(dāng)const-string給寄存器賦字符串,即

const-string v0, "\u60a8\u7684\u8bd5"

</br>const-class給寄存器賦值一個類引用.

鎖指令

鎖指令用于在多線程程序中對同一對象的操作.

monitor-enter v0

為指定的對象獲取鎖.

monitor-exit v0

釋放指定對象的鎖.

實例操作指令

  • 類型轉(zhuǎn)換指令
check-cast v0,type@BBBB

v0寄存器轉(zhuǎn)換成指定的類型.

  • 檢查指令
instance-of v0,v1,type@BBBB

檢測v1是否可以轉(zhuǎn)換成指定類型,可以轉(zhuǎn)換v0賦值為1,否則賦值 0.

  • 創(chuàng)建指令
new-instance v0,type@BBBB

構(gòu)造一個指定類型的實例,并把實例對象的引用賦值給v0.類型符 type指定類型不能為數(shù)組.

數(shù)組操作指令

  • 創(chuàng)建數(shù)組
new-array v0,v1,type@BBBB

構(gòu)造指定類型的數(shù)組,v1表示數(shù)組的大小,并將數(shù)組賦值給v0.

filed-new-array {v1,v2,v3},type@BBBB

構(gòu)造數(shù)組的另一種方式,即相當(dāng)于Java中的
int[] arrays= {1,2,3,4};

  • 獲取數(shù)組長度
array-length v0,v1

獲取v1寄存器中的數(shù)組長度,并賦值給v0寄存器.

跳轉(zhuǎn)指令

  • goto指令
goto +AA

無條件跳轉(zhuǎn)到指定偏移量處,偏移量不能為0.

  • switch指令
packed-switch v0,+BBBB

分支跳轉(zhuǎn),v0寄存器為switch分支中的判斷值,+BBBB指向的是packed-switch-payload格式的偏移表,表中的值是有規(guī)律的.

sparse-switch v0,+BBBB

作用同上,唯一不同是偏移表中的值是無規(guī)律的.

  • if指令
    if指令格式如下
    if-eq(此處可替換) v0,v1,+BBBB
    比較兩個寄存器的值,符合條件進(jìn)行跳轉(zhuǎn).
操作符 作用 對應(yīng)java語句
if-eq 如果v0等于v1則跳轉(zhuǎn). if(v0==v1)
if-ne 如果v0不等于v1則跳轉(zhuǎn). if(v0!=v1)
if-lt 如果v0小于v1則跳轉(zhuǎn). if(v0<v1)
if-gt 如果v0大于v1則跳轉(zhuǎn). if(v0>v1)
if-le 如果v0小于等于v1則跳轉(zhuǎn). if(v0<=v1)
if-ge 如果v0大于等于v1則跳轉(zhuǎn). if(v0>=v1)
    if-eq(此處可替換) v0,+BBBB

用寄存器中的值和0進(jìn)行比較,符合跳轉(zhuǎn)跳轉(zhuǎn).

操作符 作用 對應(yīng)java語句
if-eqz 如果v0等于0則跳轉(zhuǎn). if(v0==0)
if-nez 如果v0不等于0則跳轉(zhuǎn). if(v0!=0)
if-ltz 如果v0小于0則跳轉(zhuǎn). if(v0<0)
if-gtz 如果v0大于0則跳轉(zhuǎn). if(v0>0)
if-lez 如果v0小于等于0則跳轉(zhuǎn). if(v0<=0)
if-gez 如果v0大于等于0則跳轉(zhuǎn). if(v0>=0)

比較指令

用于比較兩個寄存器的值(浮點型或長整型),比較結(jié)果放到v0寄存器中.
格式

cmpl-float(此處可替換) v0,v1,v2
操作符 作用
cmpl-float 如果v1小于v2則結(jié)果為1,相等則結(jié)果為0,大于則結(jié)果為-1.
cmpg-float 如果v1大于v2則結(jié)果為1,相等則結(jié)果為0,小于則結(jié)果為-1.
cmpl-double 如果v1小于v2則結(jié)果為1,相等則結(jié)果為0,大于則結(jié)果為-1.
cmpg-double 如果v1大于v2則結(jié)果為1,相等則結(jié)果為0,小于則結(jié)果為-1.
cmp-long 如果v1大于v2則結(jié)果為1,相等則結(jié)果為0,小于則結(jié)果為-1.

字段操作指令

字段操作指令分兩大類:普通字段和靜態(tài)字段,普通字段指令的前綴為i,靜態(tài)字段指令的前綴為s.
字段的讀操作指令為get,寫操作指令為put,因此普通字段的操作指令為iget,iput.靜態(tài)字段的操作指令為sget,sput.
指令格式如下

.line 16
iput-object p1, p0, Lcom/view/dialogapplication/PhoneInfo;->context:Landroid/content/Context;

上面是一段iput指令代碼,它所對應(yīng)的java代碼如下

  this.context = context;

沒錯,它就會一個簡單的賦值context的代碼;
由此,可以看出來, p1是要賦值的context,p0是源,而后面的第三個參數(shù)

Lcom/view/dialogapplication/PhoneInfo;->context:Landroid/content/Context;

可以看出來是p1的字段名.

此外還有一組以a為前綴的的操作指令,分別為aputaget,不過它們應(yīng)該不算在字段的范疇了,應(yīng)該為數(shù)組操作范疇,但因為也是和讀寫操作有關(guān),所以就寫在這里了,具體格式如下

aput-object  v2,v1,v0

其具體作用為將v2的值放入到v1數(shù)組的v0位置處.所以可以看出,v2為要放入的值,v1代表著存放v2值的數(shù)組,而v0則是v2要存放在數(shù)組的位置,即v0為index(數(shù)組角標(biāo)).

方法調(diào)用指令

方法調(diào)用指令賦值調(diào)用類實例(也就是對象)的方法,它的基礎(chǔ)指令為invoke.指令格式如下

invoke-virtual(名稱后綴可替換) {v0,v1},method@BBBB(具體的方法)

其中{v0,v1}大括號中第一位放的是調(diào)用方法的對象,之后的為方法中的參數(shù).若沒有參數(shù)則只需傳入調(diào)用方法的對象,即{v0}.

指令 作用
invoke-virtualinvoke-virtual/range 調(diào)用實例的虛方法.
invoke-superinvoke-super/range 調(diào)用實例父類的方法.
invoke-directinvoke-direct/range 調(diào)用實例的直接方法.
invoke-staticinvoke-static/range 調(diào)用實例的靜態(tài)方法.
invoke-interfaceinvoke-interface/range 調(diào)用實例的接口方法.

數(shù)字轉(zhuǎn)換指令

數(shù)據(jù)轉(zhuǎn)換指令用于將一種類型的數(shù)值轉(zhuǎn)換成另一種類型.格式如下

neg-int(可替換如下) v0,v1

指令中,v1存放需要轉(zhuǎn)換的數(shù)據(jù),v0存放轉(zhuǎn)換后的結(jié)果.

指令 作用
neg-int 對整型輸求補.
not-int 對整型輸求反.
neg-long 對長整型數(shù)求補.
not-long 對長整型數(shù)求反.
neg-float 對單精度浮點型數(shù)求補.
neg-double 對雙精度浮點數(shù)求補.
int-to-long 將整型數(shù)轉(zhuǎn)換為長整型.
int-to-float 將整型數(shù)轉(zhuǎn)換為單精度浮點型.
int-to-double 將整型數(shù)轉(zhuǎn)換為雙精度浮點型.
long-to-int 將長整型數(shù)轉(zhuǎn)換位整型.
long-to-float 將長整型數(shù)轉(zhuǎn)換為單精度浮點型.
long-to-double 將長整型數(shù)轉(zhuǎn)換為雙精度浮點型.
float-to-int 將單精度浮點轉(zhuǎn)換為整型.
float-to-long 將單精度浮點型轉(zhuǎn)換為長整型.
float-to-double 將單精度浮點型轉(zhuǎn)換為雙精度浮點型.
double-to-int 將雙精度浮點型轉(zhuǎn)換為整型.
double-to-long 將雙精度浮點型轉(zhuǎn)換為長整型.
double-to-float 將雙精度浮點型轉(zhuǎn)換為單精度浮點型.
int-to-byte 將整型轉(zhuǎn)換為字節(jié)型.
int-to-char 將整型轉(zhuǎn)換為字符串.
int-to-short 將整型轉(zhuǎn)換為短整型.

數(shù)據(jù)運算指令

數(shù)據(jù)運算指令分為算術(shù)運算指令和邏輯運算指令,即 加、減、乘、除、取模、位移及與、或、非、異或等.
格式如下

add-int(可替換如下) v0,v1,v2

指令中,將v1v2進(jìn)行運算,結(jié)果存到v0.

指令 作用
add-type v1v2進(jìn)行加法運算,即v1+v2.
sub-type v1v2進(jìn)行減法運算,即v1-v2.
mul-type v1v2進(jìn)行乘法運算,即v1*v2.
div-type v1v2進(jìn)行除法運算,即v1/v2.
rem-type v1v2進(jìn)行取模運算,即v1%v2.
and-type v1v2進(jìn)行與運算,即v1 AND v2.
or-type v1v2進(jìn)行或運算,即v1 OR v2.
xor-type v1v2進(jìn)行異或運算,即v1 XOR v2.
shl-type v1進(jìn)行(有符號位)左移v2位,即v1<<v2.
shr-type v1進(jìn)行(有符號位)右移v2位,即v1>>v2.
ushr-type v1進(jìn)行(無符號位)右移v2位,即v1>>v2.

其中后面的-type可以是-int、-long、-float、-double.

至此,Dalvik指令集基本就都介紹完了
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容