前言
很早之前就寫過面向切面的編程思想,主要學(xué)習(xí)了AOP的思想(參考:AOP簡介)以及使用 AspectJ 實現(xiàn)簡單的切面編程(參考:AspectJ之切點語法)。
其他常見的AOP編程框架還有 Cglib,Hibernate 和 Spring 等等,而這些目前流行的AOP框架絕大多數(shù)底層實現(xiàn)都是直接或間接地通過 ASM 來實現(xiàn)字節(jié)碼操作。
因此,如果你想實現(xiàn)一些簡單的切面編程,直接采用上面提及的AOP框架是絕對可以實現(xiàn)的,但是這些框架相對于 ASM 來說重了許多,在你進行代碼切入的時候,可能會為你引入許多其他包的代碼,導(dǎo)致生成的class文件體積增大不少,因此,對于一些簡單的代碼切片,推薦使用 ASM 字節(jié)碼操作庫直接對class文件動態(tài)進行代碼切入。
ASM 簡介
ASM 是一個 Java 字節(jié)碼操控框架。它能被用來動態(tài)生成類或者增強既有類的功能。ASM 可以直接產(chǎn)生二進制 class 文件,也可以在類被加載入 Java 虛擬機之前動態(tài)改變類行為。Java class 被存儲在嚴(yán)格格式定義的 .class 文件里,這些類文件擁有足夠的元數(shù)據(jù)來解析類中的所有元素:類名稱、方法、屬性以及 Java 字節(jié)碼(指令)。ASM 從類文件中讀入信息后,能夠改變類行為,分析類信息,甚至能夠根據(jù)用戶要求生成新類。
簡單的說,ASM 可以讀取解析class文件內(nèi)容,并提供接口讓你可以對class文件字節(jié)碼內(nèi)容進行CRUD操作······
注: class文件存儲的是java字節(jié)碼,ASM 是對java字節(jié)碼操作的一層封裝,因此,如果你很了解 class文件格式的話,你甚至可以通過直接使用文本編輯器(eg:Vim)來改寫class文件。
知道了 ASM 的作用后,接下來我們就來看下 ASM 的執(zhí)行模式,了解它的執(zhí)行模式后,我們才能更好地使用。
ASM 框架執(zhí)行流程
ASM 提供了兩組API:Core和Tree:
- Core是基于訪問者模式來操作類的
- Tree是基于樹節(jié)點來操作類的
本文我們主要討論的是 ASM 的 CoreAPI。
ASM 內(nèi)部采用 訪問者模式 將 .class 類文件的內(nèi)容從頭到尾掃描一遍,每次掃描到類文件相應(yīng)的內(nèi)容時,都會調(diào)用ClassVisitor內(nèi)部相應(yīng)的方法。
比如:
- 掃描到類文件時,會回調(diào)
ClassVisitor的visit()方法; - 掃描到類注解時,會回調(diào)
ClassVisitor的visitAnnotation()方法; - 掃描到類成員時,會回調(diào)
ClassVisitor的visitField()方法; - 掃描到類方法時,會回調(diào)
ClassVisitor的visitMethod()方法;
······
掃描到相應(yīng)結(jié)構(gòu)內(nèi)容時,會回調(diào)相應(yīng)方法,該方法會返回一個對應(yīng)的字節(jié)碼操作對象(比如,visitMethod()返回MethodVisitor實例),通過修改這個對象,就可以修改class文件相應(yīng)結(jié)構(gòu)部分內(nèi)容,最后將這個ClassVisitor字節(jié)碼內(nèi)容覆蓋原來.class文件就實現(xiàn)了類文件的代碼切入。
具體關(guān)系如下:
| 樹形關(guān)系 | 使用的接口 |
|---|---|
| Class | ClassVisitor |
| Field | FieldVisitor |
| Method | MethodVisitor |
| Annotation | AnnotationVisitor |
整個具體的執(zhí)行時序如下圖所示:

通過時序圖可以看出ASM在處理class文件的整個過程。ASM通過樹這種數(shù)據(jù)結(jié)構(gòu)來表示復(fù)雜的字節(jié)碼結(jié)構(gòu),并利用 Push模型 來對樹進行遍歷。
-
ASM 中提供一個
ClassReader類,這個類可以直接由字節(jié)數(shù)組或者class文件間接的獲得字節(jié)碼數(shù)據(jù)。它會調(diào)用accept()方法,接受一個實現(xiàn)了抽象類ClassVisitor的對象實例作為參數(shù),然后依次調(diào)用ClassVisitor的各個方法。字節(jié)碼空間上的偏移被轉(zhuǎn)成各種visitXXX方法。使用者只需要在對應(yīng)的的方法上進行需求操作即可,無需考慮字節(jié)偏移。 - 這個過程中
ClassReader可以看作是一個事件生產(chǎn)者,ClassWriter繼承自ClassVisitor抽象類,負責(zé)將對象化的class文件內(nèi)容重構(gòu)成一個二進制格式的class字節(jié)碼文件,ClassWriter可以看作是一個事件的消費者。
至此,相信讀者已經(jīng)對 ASM 框架的執(zhí)行過程有一定了解了。接下來我們還剩的一點內(nèi)容就是如何實現(xiàn)class文件字節(jié)碼的修改。
ASM 字節(jié)碼修改
由于 ASM 是直接對class文件的字節(jié)碼進行操作,因此,要修改class文件內(nèi)容時,也要注入相應(yīng)的java字節(jié)碼。
所以,在注入字節(jié)碼之前,我們還需要了解下class文件的結(jié)構(gòu),JVM指令等知識。
-
class文件結(jié)構(gòu)
Java源文件經(jīng)過javac編譯器編譯之后,將會生成對應(yīng)的二進制.class文件,如下圖所示:

Java類文件是 8 位字節(jié)的二進制流。數(shù)據(jù)項按順序存儲在class文件中,相鄰的項之間沒有間隔,這使得class文件變得緊湊,減少存儲空間。在Java類文件中包含了許多大小不同的項,由于每一項的結(jié)構(gòu)都有嚴(yán)格規(guī)定,這使得 class 文件能夠從頭到尾被順利地解析。
每個class文件都是有固定的結(jié)構(gòu)信息,而且保留了源碼文件中的符號。下圖是class文件的格式圖。其中帶 * 號的表示可重復(fù)的結(jié)構(gòu)。

類結(jié)構(gòu)體中所有的修飾符、字符常量和其他常量都被存儲在class文件開始的一個常量堆棧(Constant Stack)中,其他結(jié)構(gòu)體通過索引引用。
每個類必須包含headers(包括:class name, super class, interface, etc.)和常量堆棧(Constant Stack)其他元素,例如:字段(fields)、方法(methods)和全部屬性(attributes)可以選擇顯示或者不顯示。
每個字段塊(Field section)包括名稱、修飾符(public, private, etc.)、描述符號(descriptor)和字段屬性。
每個方法區(qū)域(Method section)里面的信息與header部分的信息類似,信息關(guān)于最大堆棧(max stack)和最大本地變量數(shù)量(max local variable numbers)被用于修改字節(jié)碼。對于非abstract和非native的方法有一個方法指令表,exceptions表和代碼屬性表。除此之外,還可以有其他方法屬性。
每個類、字段、方法和方法代碼的屬性有屬于自己的名稱記錄在類文件格式的JVM規(guī)范的部分,這些屬性展示了字節(jié)碼多方面的信息,例如源文件名、內(nèi)部類、簽名、代碼行數(shù)、本地變量表和注釋。JVM規(guī)范允許定義自定義屬性,這些屬性會被標(biāo)準(zhǔn)的VM(虛擬機)忽略,但是可以包含附件信息。
方法代碼表包含一系列對java虛擬機的指令。有些指令在代碼中使用偏移量,當(dāng)指令從方法代碼被插入或者移除時,全部偏移量的值可能需要調(diào)整。
-
Java類型與class文件內(nèi)部類型對應(yīng)關(guān)系
Java類型分為基本類型和引用類型,在 JVM 中對每一種類型都有與之相對應(yīng)的類型描述,如下表:
| Java type | JVM Type descriptor |
|---|---|
| boolean | Z |
| char | C |
| byte | B |
| short | S |
| int | I |
| float | F |
| long | J |
| double | D |
| Object | Ljava/lang/Object; |
| int[] | [I |
| Object[][] | [[Ljava/lang/Object; |
在 ASM 中要獲得一個類的 JVM 內(nèi)部描述,可以使用org.objectweb.asm.Type類中的getDescriptor(final Class c)方法,如下:
public class TypeDescriptors {
public static void main(String[] args) {
System.out.println(Type.getDescriptor(TypeDescriptors.class));
System.out.println(Type.getDescriptor(String.class));
}
}
運行結(jié)果:
Lorg/victorzhzh/core/structure/TypeDescriptors;
Ljava/lang/String;
-
Java方法聲明與class文件內(nèi)部聲明的對應(yīng)關(guān)系
在·Java·的二進制文件中,方法的方法名和方法的描述都是存儲在Constant pool 中的,且在兩個不同的單元里。因此,方法描述中不含有方法名,只含有參數(shù)類型和返回類型。
格式:(參數(shù)描述符)返回值描述符
| Method declaration in source file | Method descriptor |
|---|---|
| void m(int i, float f) | (IF)V |
| int m(Object o) | (Ljava/lang/Object;)I |
| int[] m(int i, String s) | (ILjava/lang/String;)[I |
| Object m(int[] i) | ([I]Ljava/lang/Object; |
| String m() | ()Ljava/lang/String; |
-
JVM 指令
假設(shè)現(xiàn)在我們有如下一個類:
package com.yn.test;
public class Test {
public static void main(String[] agrs){
System.out.println("Hello World!");
}
}
我們先用javac com/yn/test/Test.java編譯得到Test.class文件,然后再使用javap -c com/yn/test/Test來查看下這個Test.class文件的字節(jié)碼,結(jié)果如下圖所示:

- 上圖中第3行到第7行,是類
Test的默認(rèn)構(gòu)造函數(shù)(由編譯器默認(rèn)生成),Code以下部分是構(gòu)造函數(shù)內(nèi)部代碼,其中:
- aload_0: 這個指令是LOAD系列指令中的一個,它的意思表示裝載當(dāng)前第 0 個元素到堆棧中。代碼上相當(dāng)于“this”。而這個數(shù)據(jù)元素的類型是一個引用類型。這些指令包含了:ALOAD,ILOAD,LLOAD,F(xiàn)LOAD,DLOAD。區(qū)分它們的作用就是針對不用數(shù)據(jù)類型而準(zhǔn)備的LOAD指令,此外還有專門負責(zé)處理數(shù)組的指令 SALOAD。
- invokespecial: 這個指令是調(diào)用系列指令中的一個。其目的是調(diào)用對象類的方法。后面需要給上父類的方法完整簽名?!?1”的意思是 .class 文件常量表中第1個元素。值為:“java/lang/Object."<init>":()V”。結(jié)合ALOAD_0。這兩個指令可以翻譯為:“super()”。其含義是調(diào)用自己的父類構(gòu)造方法。
- 第9到14行是
main方法,Code以下是其字節(jié)碼表示:
-
getstatic: 這個指令是GET系列指令中的一個其作用是獲取靜態(tài)字段內(nèi)容到堆棧中。這一系列指令包括了:GETFIELD、GETSTATIC。它們分別用于獲取動態(tài)字段和靜態(tài)字段。此處表示的意思獲取靜態(tài)成員
System.out到堆棧中。 - ldc:這個指令的功能是從常量表中裝載一個數(shù)據(jù)到堆棧中。此處表示從常量池中獲取字符串"Hello World!"。
-
invokevirtual:也是一種調(diào)用指令,這個指令區(qū)別與 invokespecial 的是它是根據(jù)引用調(diào)用對象類的方法。此處表示調(diào)用
java.io.PrintStream.println(String)方法,結(jié)合前面的操作,這里調(diào)用的就是System.out.println("Hello World!")。 - return: 這也是一系列指令中的一個,其目的是方法調(diào)用完畢返回:可用的其他指令有:IRETURN,DRETURN,ARETURN等,用于表示不同類型參數(shù)的返回。
更多詳細內(nèi)容,請參考:JVM字節(jié)碼指令理解,JVM指令,深入字節(jié)碼 -- 使用 ASM 實現(xiàn) AOP
更多字節(jié)碼指令詳情,請參考官網(wǎng):The Java Virtual Machine Instruction Set
接下來,我們就可以根據(jù)上面所講的內(nèi)容,將代碼字節(jié)碼注入到class文件中了。
現(xiàn)在假設(shè)我們想要在類Test的main方法前后動態(tài)插入代碼,如下所示:
package com.yn.test;
public class Test {
public static void main(String[] agrs){
System.out.println("asm insert before");
System.out.println("Hello World!");
System.out.println("asm insert after");
}
}
要完成在main方法前后插入輸出代碼,需要以下幾步操作:
- 讀取
Test.class文件,可以通過 ASM 提供的ClassReader類進行class文件的讀取與遍歷。
// 使用全限定名,創(chuàng)建一個ClassReader對象
ClassReader classReader = new ClassReader("com.yn.test.Test");
// 構(gòu)建一個ClassWriter對象,并設(shè)置讓系統(tǒng)自動計算棧和本地變量大小
ClassWriter classWriter = new ClassWriter(ClassWriter.COMPUTE_MAXS);
//創(chuàng)建一個自定義ClassVisitor,方便后續(xù)ClassReader的遍歷通知
ClassVisitor classVisitor = new TestClassVisitor(classWriter);
//開始掃描class文件
classReader.accept(classVisitor, ClassReader.SKIP_DEBUG);
-
構(gòu)造
System.out.println(String)的 ASM 代碼。
上面我們從javap反編譯得到的字節(jié)碼可以知道,實現(xiàn)System.out.println("Hello World!");的字節(jié)碼總共需要3步操作:
(1). 獲取System靜態(tài)成員out,其對應(yīng)的指令為getstatic,對應(yīng)的 ASM 代碼為:
mv.visitFieldInsn(Opcodes.GETSTATIC,
Type.getInternalName(System.class), //"java/lang/System"
"out",
Type.getDescriptor(PrintStream.class) //"Ljava/io/PrintStream;"
);
(2). 獲取字符串常量"Hello World!",其對應(yīng)的指令為ldc,對應(yīng)的 ASM 代碼為:
mv.visitLdcInsn("Hello World!");
(3). 獲取PrintStream.println(String)方法,其對應(yīng)的指令為invokervirtual,對應(yīng)的 ASM 代碼為:
mv.visitMethodInsn(Opcodes.INVOKEVIRTUAL,
Type.getInternalName(PrintStream.class), //"java/io/PrintStream"
"println",
"(Ljava/lang/String;)V",//方法描述符
false);
- 在
main方法進入前,進行代碼插入,可以通過MethodVisitor.visitCode()方法。
// 在源方法前去修改方法內(nèi)容,這部分的修改將加載源方法的字節(jié)碼之前
@Override
public void visitCode() {
mv.visitCode();
System.out.println("method start to insert code");
sop("asm insert before");//this is the insert code
}
- 在
main方法退出前,進行代碼插入,可以通關(guān)過MethodVisitor.visitInsn()方法,通過判斷當(dāng)前的指令為return時,表明即將執(zhí)行return語句,此時插入字節(jié)碼即可。
@Override
public void visitInsn(int opcode) {
//檢測到return語句
if (opcode == Opcodes.RETURN) {
System.out.println("method end to insert code");
sop("asm insert after");
}
//執(zhí)行原本語句
mv.visitInsn(opcode);
}
- 字節(jié)碼插入
class文件成功后,導(dǎo)出字節(jié)碼到原文件中。
//獲取改寫后的class二進制字節(jié)碼
byte[] classFile = classWriter.toByteArray();
// 將這個類輸出到原先的類文件目錄下,這是原先的類文件已經(jīng)被修改
File file = new File("E:/code/Android/Projects/AsmButterknife/sample-java/build/classes/java/main/com/yn/test/Test.class");
FileOutputStream fos = new FileOutputStream(file);
fos.write(classFile);
fos.close();
至此,我們已經(jīng)完成了對Test.class的代碼注入。
詳細代碼請參見:AsmTest
注: asm-commons 包中提供了一個類AdviceAdapter,使用該類可以更加方便的讓我們在方法前后注入代碼,因為其提供了方法onMethodEnter()和onMethodExit()。
通過上面介紹的內(nèi)容,我們已經(jīng)成功使用 ASM 動態(tài)注入字節(jié)碼到class文件中。但是如果直接采用 ASM 代碼注入字節(jié)碼,還是相對困難的,幸運的是 ASM 給我們提供了 ASMifier 工具,使得我們可以直接通過.class文件反編譯為 ASM 代碼。
因此,當(dāng)我們要使用 ASM 框架往class文件注入字節(jié)碼時,我們通常是將要注入的java源碼先寫出來,然后通過javac編譯出目標(biāo).class文件,然后再通過 ASMifier 工具反編譯該.class文件,得到所需的 ASM 注入代碼。
ASMifier 存在于asm-util.jar中,同時需要依賴asm.jar,幸運的是 ASM 提供了一個asm-all.jar包,可以方便我們直接運行 ASMifier。
asm-all.jar下載地址:asm-all
運行命令如下:
java -classpath "asm-all.jar" org.objectweb.asm.util.ASMifier org/domain/package/YourClass.class
如果還嫌上面的操作麻煩,github 上已經(jīng)有人寫了個前端頁面方便我們將源碼轉(zhuǎn)變?yōu)?ASM 代碼操作:asmifier