初識匯編
我們在前期的學(xué)習(xí)中,了解到在逆向開發(fā)中,非常重要的一個環(huán)節(jié)就是靜態(tài)分析.首先我們是逆向iOS系統(tǒng)上面的APP.那么我們知道,一個APP安裝在手機(jī)上面的可執(zhí)行文件本質(zhì)上是二進(jìn)制文件.因?yàn)閕Phone手機(jī)本質(zhì)上執(zhí)行的指令是二進(jìn)制.是由手機(jī)上的CPU執(zhí)行的.所以靜態(tài)分析是建立在分析二進(jìn)制上面.所以今天我們接下來的課程從非?;A(chǔ)的東西開始講解.
匯編語言的發(fā)展
機(jī)器語言
由0和1組成的機(jī)器指令.
加:0100 0000 減:0100 1000 乘:1111 0111 1110 0000 除:1111 0111 1111 0000
匯編語言(assembly language)
使用助記符代替機(jī)器語言
如:
加:INC EAX 通過編譯器 0100 0000 減:DEC EAX 通過編譯器 0100 1000 乘:MUL EAX 通過編譯器 1111 0111 1110 0000 除:DIV EAX 通過編譯器 1111 0111 1111 0000
高級語言(High-level programming language)
C\C++\Java\OC\Swift,更加接近人類的自然語言
比如C語言:
加:A+B 通過編譯器 0100 0000 減:A-B 通過編譯器 0100 1000 乘:A*B 通過編譯器 1111 0111 1110 0000 除:A/B 通過編譯器 1111 0111 1111 0000
我們的代碼在終端設(shè)備上是這樣的過程:

匯編語言與機(jī)器語言一一對應(yīng),每一條機(jī)器指令都有與之對應(yīng)的匯編指令
匯編語言可以通過編譯得到機(jī)器語言,機(jī)器語言可以通過反匯編得到匯編語言
高級語言可以通過編譯得到匯編語言 \ 機(jī)器語言,但匯編語言\機(jī)器語言幾乎不可能還原成高級語言
匯編語言的特點(diǎn)
可以直接訪問、控制各種硬件設(shè)備,比如存儲器、CPU等,能最大限度地發(fā)揮硬件的功能
能夠不受編譯器的限制,對生成的二進(jìn)制代碼進(jìn)行完全的控制
目標(biāo)代碼簡短,占用內(nèi)存少,執(zhí)行速度快
匯編指令是機(jī)器指令的助記符,同機(jī)器指令一一對應(yīng)。每一種CPU都有自己的機(jī)器指令集\匯編指令集,所以匯編語言不具備可移植性
知識點(diǎn)過多,開發(fā)者需要對CPU等硬件結(jié)構(gòu)有所了解,不易于編寫、調(diào)試、維護(hù)
不區(qū)分大小寫,比如mov和MOV是一樣的
匯編的用途
- 編寫驅(qū)動程序、操作系統(tǒng)(比如Linux內(nèi)核的某些關(guān)鍵部分)
- 對性能要求極高的程序或者代碼片段,可與高級語言混合使用(內(nèi)聯(lián)匯編)
- 軟件安全
- 病毒分析與防治
- 逆向\加殼\脫殼\破解\外掛\免殺\加密解密\漏洞\黑客
- 理解整個計(jì)算機(jī)系統(tǒng)的最佳起點(diǎn)和最有效途徑
- 為編寫高效代碼打下基礎(chǔ)
- 弄清代碼的本質(zhì)
- 函數(shù)的本質(zhì)究竟是什么?
- ++a + ++a + ++a 底層如何執(zhí)行的?
- 編譯器到底幫我們干了什么?
- DEBUG模式和RELEASE模式有什么關(guān)鍵的地方被我們忽略
** ......
最后來句裝13的話
越底層越單純!真正的程序員都需要了解的一門非常重要的語言,匯編!
匯編語言的種類
目前討論比較多的匯編語言有
- 8086匯編(8086處理器是16bit的CPU)
- Win32匯編
- Win64匯編
- ARM匯編(嵌入式、Mac、iOS)
- ......
我們iPhone里面用到的是ARM匯編,但是不同的設(shè)備也有差異.因CPU的架構(gòu)不同.
架構(gòu) 設(shè)備
armv6 iPhone, iPhone2, iPhone3G, 第一代、第二代 iPod Touch
armv7 iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4
armv7s iPhone5, iPhone5C, iPad4(iPad with Retina Display)
arm64 iPhone5S 以后 iPhoneX , iPad Air, iPad mini2以后
幾個必要的常識
- 要想學(xué)好匯編,首先需要了解CPU等硬件結(jié)構(gòu)
-
APP/程序的執(zhí)行過程
2.jpg
- 硬件相關(guān)最為重要是CPU/內(nèi)存
- 在匯編中,大部分指令都是和CPU與內(nèi)存相關(guān)的
總線


- 每一個CPU芯片都有許多管腳,這些管腳和總線相連,CPU通過總線跟外部器件進(jìn)行交互
- 總線:一根根導(dǎo)線的集合
- 總線的分類
- 地址總線
- 數(shù)據(jù)總線
-
控制總線
5.jpg
舉個例子

- 地址總線
- 它的寬度決定了CPU的尋址能力
-
8086的地址總線寬度是20,所以尋址能力是1M( 220 )
7.png
- 數(shù)據(jù)總線
- 它的寬度決定了CPU的單次數(shù)據(jù)傳送量,也就是數(shù)據(jù)傳送速度
- 8086的數(shù)據(jù)總線寬度是16,所以單次最大傳遞2個字節(jié)的數(shù)據(jù)
- 控制總線
- 它的寬度決定了CPU對其他器件的控制能力、能有多少種控制
- 做個小練習(xí)
- 一個CPU 的尋址能力為8KB,那么它的地址總線的寬度為____
- 8080,8088,80286,80386 的地址總線寬度分別為16根,20根,24根,32根.那么他們的尋址能力分別為多少____KB, ____MB,____MB,____GB?
- 8080,8088,8086,80286,80386 的數(shù)據(jù)總線寬度分別為8根,8根,16根,16根,32根.那么它們一次可以傳輸?shù)臄?shù)據(jù)為:____B,____B,____B,____B,____B,
- 從內(nèi)存中讀取1024字節(jié)的數(shù)據(jù),8086至少要讀____次,80386至少要讀取____次.
答案

練習(xí)
內(nèi)存
各類存儲區(qū)的邏輯連接

各類存儲器的邏輯連接-物理地址對應(yīng)圖

各類存儲器的物理地址情況

內(nèi)存地址空間的大小受CPU地址總線寬度的限制。8086的地址總線寬度為20,可以定位220個不同的內(nèi)存單元(內(nèi)存地址范圍0x00000~0xFFFFF),所以8086的內(nèi)存空間大小為1MB
0x00000~0x9FFFF:主存儲器??勺x可寫
0xA0000~0xBFFFF:向顯存中寫入數(shù)據(jù),這些數(shù)據(jù)會被顯卡輸出到顯示器??勺x可寫
0xC0000~0xFFFFF:存儲各種硬件\系統(tǒng)信息。只讀
進(jìn)制
學(xué)習(xí)進(jìn)制的障礙
很多人學(xué)不好進(jìn)制,原因是總以十進(jìn)制為依托去考慮其他進(jìn)制,需要運(yùn)算的時(shí)候也總是先轉(zhuǎn)換成十進(jìn)制,這種學(xué)習(xí)方法是錯誤的.
我們?yōu)槭裁匆欢ㄒD(zhuǎn)換十進(jìn)制呢?僅僅是因?yàn)槲覀儗κM(jìn)制最熟悉,所以才轉(zhuǎn)換.
每一種進(jìn)制都是完美的,想學(xué)好進(jìn)制首先要忘掉十進(jìn)制,也要忘掉進(jìn)制間的轉(zhuǎn)換!
進(jìn)制的定義
- 八進(jìn)制由8個符號組成:0 1 2 3 4 5 6 7 逢八進(jìn)一
- 十進(jìn)制由10個符號組成:0 1 2 3 4 5 6 7 8 9逢十進(jìn)一
- N進(jìn)制就是由N個符號組成:逢N進(jìn)一
做個練習(xí)
- 1 + 1 在____情況下等于 3 ?
.
.
.
.
.
.
.
.
.
.
.
.
.
十進(jìn)制由10個符號組成: 0 1 3 2 8 A B E S 7 逢十進(jìn)一
如果這樣定義十進(jìn)制: 1 + 1 = 3!就對了!
這樣的目的何在?
傳統(tǒng)我們定義的十進(jìn)制和自定義的十進(jìn)制不一樣.那么這10個符號如果我們不告訴別人這個符號表,別人是沒辦法拿到我們的具體數(shù)據(jù)的!用于加密!
十進(jìn)制由十個符號組成,逢十進(jìn)一,符號是可以自定義的!!
進(jìn)制的運(yùn)算
做個練習(xí)
- 八進(jìn)制運(yùn)算
- 2 + 3 = __ , 2 * 3 = __ ,4 + 5 = __ ,4 * 5 = __.
- 277 + 333 = __ , 276 * 54 = __ , 237 - 54 = __ , 234 / 4 = __ .
- 八進(jìn)制加法表
0 1 2 3 4 5 6 7
10 11 12 13 14 15 16 17
20 21 22 23 24 25 26 27
...
1+1 = 2
1+2 = 3 2+2 = 4
1+3 = 4 2+3 = 5 3+3 = 6
1+4 = 5 2+4 = 6 3+4 = 7 4+4 = 10
1+5 = 6 2+5 = 7 3+5 = 10 4+5 = 11 5+5 = 12
1+6 = 7 2+6 = 10 3+6 = 11 4+6 = 12 5+6 = 13 6+6 = 14
1+7 = 10 2+7 = 11 3+7 = 12 4+7 = 13 5+7 = 14 6+7 = 15 7+7 = 16
- 八進(jìn)制乘法表
0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27...
1*1 = 1
1*2 = 2 2*2 = 4
1*3 = 3 2*3 = 6 3*3 = 11
1*4 = 4 2*4 = 10 3*4 = 14 4*4 = 20
1*5 = 5 2*5 = 12 3*5 = 17 4*5 = 24 5*5 = 31
1*6 = 6 2*6 = 14 3*6 = 22 4*6 = 30 5*6 = 36 6*6 = 44
1*7 = 7 2*7 = 16 3*7 = 25 4*7 = 34 5*7 = 43 6*7 = 52 7*7 = 61
- 實(shí)戰(zhàn)四則運(yùn)算
277 236 276 234
+ 333 - 54 * 54 / 4
-------- -------- -------- --------
二進(jìn)制的簡寫形式
二進(jìn)制: 1 0 1 1 1 0 1 1 1 1 0 0
三個二進(jìn)制一組: 101 110 111 100
八進(jìn)制: 5 6 7 4
四個二進(jìn)制一組: 1011 1011 1100
十六進(jìn)制: b b c
二進(jìn)制:從0 寫到 1111
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
這種二進(jìn)制使用起來太麻煩,改成更簡單一點(diǎn)的符號:
0 1 2 3 4 5 6 7 8 9 A B C D E F 這就是十六進(jìn)制了
數(shù)據(jù)的寬度
數(shù)學(xué)上的數(shù)字,是沒有大小限制的,可以無限的大。但在計(jì)算機(jī)中,由于受硬件的制約,數(shù)據(jù)都是有長度限制的(我們稱為數(shù)據(jù)寬度),超過最多寬度的數(shù)據(jù)會被丟棄。
#import <UIKit/UIKit.h>
#import "AppDelegate.h"
int test(){
int cTemp = 0x1FFFFFFFF;
return cTemp;
}
int main(int argc, char * argv[]) {
printf("%x\n",test());
@autoreleasepool {
return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
}
}
計(jì)算機(jī)中常見的數(shù)據(jù)寬度
- 位(Bit): 1個位就是1個二進(jìn)制位.0或者1
- 字節(jié)(Byte): 1個字節(jié)由8個Bit組成(8位).內(nèi)存中的最小單元Byte.
- 字(Word): 1個字由2個字節(jié)組成(16位),這2個字節(jié)分別稱為高字節(jié)和低字節(jié).
-
雙字(Doubleword): 1個雙字由兩個字組成(32位)
那么計(jì)算機(jī)存儲數(shù)據(jù)它會分為有符號數(shù)和無符號數(shù).那么關(guān)于這個看圖就理解了!
15178439312380.jpg
無符號數(shù),直接換算!
有符號數(shù):
正數(shù): 0 1 2 3 4 5 6 7
負(fù)數(shù): F E D B C A 9 8
-1 -2 -3 -4 -5 -6 -7 -8
自定義進(jìn)制符號
練習(xí)
- 現(xiàn)在有10進(jìn)制數(shù) 10個符號分別是:2,9,1,7,6,5,4, 8,3 , A 逢10進(jìn)1 那么: 123 + 234 = ____
十進(jìn)制: 0 1 2 3 4 5 6 7 8 9
自定義: 2 9 1 7 6 5 4 8 3 A
92 99 91 97 96 95 94 98 93 9A
12 19 11 17 16 15 14 18 13 1A
72 79 71 77 76 75 74 78 73 7A
62 69 61 67 66 65 64 68 63 6A
52 59 51 57 56 55 54 58 53 5A
42 49 41 47 46 45 44 48 43 4A
82 89 81 87 86 85 84 88 83 8A
32 39 31 37 36 35 34 38 33 3A
922
那么剛才通過10進(jìn)制運(yùn)算可以轉(zhuǎn)化10進(jìn)制然后查表!但是如果是其他進(jìn)制.我們就不能轉(zhuǎn)換,要直接學(xué)會查表
- 現(xiàn)在有9進(jìn)制數(shù) 9個符號分別是:2,9,1,7,6,5,4, 8,3 逢9進(jìn)1 那么: 123 + 234 = ____
十進(jìn)制: 0 1 2 3 4 5 6 7 8
自定義: 2 9 1 7 6 5 4 8 3
92 99 91 97 96 95 94 98 93
12 19 11 17 16 15 14 18 13
72 79 71 77 76 75 74 78 73
62 69 61 67 66 65 64 68 63
52 59 51 57 56 55 54 58 53
42 49 41 47 46 45 44 48 43
82 89 81 87 86 85 84 88 83
32 39 31 37 36 35 34 38 33
922
CPU&寄存器
內(nèi)部部件之間由總線連接

CPU除了有控制器、運(yùn)算器還有寄存器。其中寄存器的作用就是進(jìn)行數(shù)據(jù)的臨時(shí)存儲。
CPU的運(yùn)算速度是非常快的,為了性能CPU在內(nèi)部開辟一小塊臨時(shí)存儲區(qū)域,并在進(jìn)行運(yùn)算時(shí)先將數(shù)據(jù)從內(nèi)存復(fù)制到這一小塊臨時(shí)存儲區(qū)域中,運(yùn)算時(shí)就在這一小快臨時(shí)存儲區(qū)域內(nèi)進(jìn)行。我們稱這一小塊臨時(shí)存儲區(qū)域?yàn)榧拇嫫鳌?br> 對于arm64系的CPU來說, 如果寄存器以x開頭則表明的是一個64位的寄存器,如果以w開頭則表明是一個32位的寄存器,在系統(tǒng)中沒有提供16位和8位的寄存器供訪問和使用。其中32位的寄存器是64位寄存器的低32位部分并不是獨(dú)立存在的。
- 對程序員來說,CPU中最主要部件是寄存器,可以通過改變寄存器的內(nèi)容來實(shí)現(xiàn)對CPU的控制
- 不同的CPU,寄存器的個數(shù)、結(jié)構(gòu)是不相同的
浮點(diǎn)和向量寄存器
因?yàn)楦↑c(diǎn)數(shù)的存儲以及其運(yùn)算的特殊性,CPU中專門提供浮點(diǎn)數(shù)寄存器來處理浮點(diǎn)數(shù)
浮點(diǎn)寄存器 64位: D0 - D31 32位: S0 - S31
現(xiàn)在的CPU支持向量運(yùn)算.(向量運(yùn)算在圖形處理相關(guān)的領(lǐng)域用得非常的多)為了支持向量計(jì)算系統(tǒng)了也提供了眾多的向量寄存器.向量寄存器 128位:V0-V31
通用寄存器
通用寄存器也稱數(shù)據(jù)地址寄存器通常用來做數(shù)據(jù)計(jì)算的臨時(shí)存儲、做累加、計(jì)數(shù)、地址保存等功能。定義這些寄存器的作用主要是用于在CPU指令中保存操作數(shù),在CPU中當(dāng)做一些常規(guī)變量來使用。
ARM64擁有有32個64位的通用寄存器 x0 到 x30,以及XZR(零寄存器),這些通用寄存器有時(shí)也有特定用途。
- 那么w0 到 w28 這些是32位的. 因?yàn)?4位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.
- 比如 w0 就是 x0的低32位!
注意:
了解過8086匯編的同學(xué)知道,有一種特殊的寄存器段寄存器:CS,DS,SS,ES四個寄存器來保存這些段的基地址,這個屬于Intel架構(gòu)CPU中.在ARM中并沒有
- 通常,CPU會先將內(nèi)存中的數(shù)據(jù)存儲到通用寄存器中,然后再對通用寄存器中的數(shù)據(jù)進(jìn)行運(yùn)算
- 假設(shè)內(nèi)存中有塊紅色內(nèi)存空間的值是3,現(xiàn)在想把它的值加1,并將結(jié)果存儲到藍(lán)色內(nèi)存空間
CPU首先會將紅色內(nèi)存空間的值放到X0寄存器中:mov X0,紅色內(nèi)存空間
然后讓X0寄存器與1相加:add X0,1
最后將值賦值給內(nèi)存空間:mov 藍(lán)色內(nèi)存空間,X0
pc寄存器(program counter)
為指令指針寄存器,它指示了CPU當(dāng)前要讀取指令的地址
在內(nèi)存或者磁盤上,指令和數(shù)據(jù)沒有任何區(qū)別,都是二進(jìn)制信息
CPU在工作的時(shí)候把有的信息看做指令,有的信息看做數(shù)據(jù),為同樣的信息賦予了不同的意義
比如 1110 0000 0000 0011 0000 1000 1010 1010
可以當(dāng)做數(shù)據(jù) 0xE003008AA
也可以當(dāng)做指令 mov x0, x8
CPU根據(jù)什么將內(nèi)存中的信息看做指令?
CPU將pc指向的內(nèi)存單元的內(nèi)容看做指令
如果內(nèi)存中的某段內(nèi)容曾被CPU執(zhí)行過,那么它所在的內(nèi)存單元必然被pc指向過
高速緩存
iPhoneX上搭載的ARM處理器A11它的1級緩存的容量是64KB,2級緩存的容量8M.
CPU每執(zhí)行一條指令前都需要從內(nèi)存中將指令讀取到CPU內(nèi)并執(zhí)行。而寄存器的運(yùn)行速度相比內(nèi)存讀寫要快很多,為了性能,CPU還集成了一個高速緩存存儲區(qū)域.當(dāng)程序在運(yùn)行時(shí),先將要執(zhí)行的指令代碼以及數(shù)據(jù)復(fù)制到高速緩存中去(由操作系統(tǒng)完成).CPU直接從高速緩存依次讀取指令來執(zhí)行.
bl指令
CPU從何處執(zhí)行指令是由pc中的內(nèi)容決定的,我們可以通過改變pc的內(nèi)容來控制CPU執(zhí)行目標(biāo)指令
ARM64提供了一個mov指令(傳送指令),可以用來修改大部分寄存器的值,比如
mov x0,#10、mov x1,#20
但是,mov指令不能用于設(shè)置pc的值,ARM64沒有提供這樣的功能
ARM64提供了另外的指令來修改PC的值,這些指令統(tǒng)稱為轉(zhuǎn)移指令,最簡單的是bl指令
bl指令 -- 練習(xí)
現(xiàn)在有兩段代碼!假設(shè)程序先執(zhí)行A,請寫出指令執(zhí)行順序.最終寄存器x0的值是多少?
_A:
mov x0,#0xa0
mov x1,#0x00
add x1, x0, #0x14
mov x0,x1
bl _B
mov x0,#0x0
ret
_B:
add x0, x0, #0x10
ret



