深入理解計(jì)算機(jī)系統(tǒng)(CS:APP) - Bomb Lab詳解

本文首發(fā)于我的博客

Bomb Lab

實(shí)驗(yàn)代碼見GitHub

簡介

BombLab是CS:APP中對應(yīng)第三章內(nèi)容:程序的機(jī)器級表示的lab。主要內(nèi)容為提供一個(gè)二進(jìn)制對象文件bomb,當(dāng)運(yùn)行時(shí),它會要求用戶輸入六個(gè)字符串,如果其中的任何一個(gè)不正確,炸彈就會爆炸,輸出一行錯(cuò)誤信息并向計(jì)分服務(wù)器提交(自學(xué)所用的材料不會向服務(wù)器提交信息,但這不代表我們可以隨意讓炸彈爆炸),學(xué)生必須通過反匯編和逆向工程來找到六個(gè)正確的字符串來解除自己的炸彈(理論上每個(gè)人的炸彈答案都不同,但自學(xué)材料的答案都是一樣的,本文針對的是自學(xué)材料)。

所用工具

objdump-用于反匯編二進(jìn)制對象文件

VS Code-用于查看反匯編后的結(jié)果與文本文件的編寫

gdb-用于運(yùn)行時(shí)單步調(diào)試與查看運(yùn)行時(shí)內(nèi)存與寄存器信息

解題過程

前期

由于之前沒有接觸過類似的逆向工程問題,拿到問題以后第一時(shí)間很難馬上開始解決。所以先查看我們能看到的文件信息。

目錄中提供了一個(gè)bomb.c文件,文件內(nèi)容十分簡單,有一份非常有趣的LISENCE:

/***************************************************************************

* Dr. Evil's Insidious Bomb, Version 1.1

* Copyright 2011, Dr. Evil Incorporated. All rights reserved.

* LICENSE:

* Dr. Evil Incorporated (the PERPETRATOR) hereby grants you (the

* VICTIM) explicit permission to use this bomb (the BOMB). This is a

* time limited license, which expires on the death of the VICTIM.

* The PERPETRATOR takes no responsibility for damage, frustration,

* insanity, bug-eyes, carpal-tunnel syndrome, loss of sleep, or other

* harm to the VICTIM. Unless the PERPETRATOR wants to take credit,

* that is. The VICTIM may not distribute this bomb source code to

* any enemies of the PERPETRATOR. No VICTIM may debug,

* reverse-engineer, run "strings" on, decompile, decrypt, or use any

* other technique to gain knowledge of and defuse the BOMB. BOMB

* proof clothing may not be worn when handling this program. The

* PERPETRATOR will not apologize for the PERPETRATOR's poor sense of

* humor. This license is null and void where the BOMB is prohibited

* by law.

***************************************************************************/

接下來的部分就是main函數(shù),從主函數(shù)中我們可以看到整個(gè)程序的結(jié)構(gòu)與輸入方式:可以從標(biāo)準(zhǔn)輸入或文件中讀取,一行作為一題的解,解出一個(gè)問題以后可以進(jìn)入下一個(gè)問題,注意到返回前的一段注釋:

? /* Wow, they got it! But isn't something... missing? Perhaps

? * something they overlooked? Mua ha ha ha ha! */

暗示了我們隱藏問題的存在,除此之外再也沒有任何關(guān)于這個(gè)炸彈的信息。

下面我們使用objdump命令將炸彈文件反匯編出來:

objdump -d bomb > bomb.asm

然后通過VS Code來查看反匯編的結(jié)果,VS Codex86 and x86_64 Assembly這個(gè)插件可以高亮匯編,看起來會舒服許多。

反匯編出來的代碼有近六千行,但是因?yàn)橛蟹柋淼拇嬖?,說明保留了調(diào)試所需的信息,我們可以通過gdb進(jìn)行單步調(diào)試來查看程序的運(yùn)行過程。

在使用gdb 的時(shí)候,我們可以加上-tui命令并用layout asm命令切換到匯編指令模式,就可以在調(diào)試的時(shí)候查看對應(yīng)的匯編代碼了。界面如下:

bomblab1.jpg

可以看到地址0x400da0就是main函數(shù)的地址。

一直向下查看,我們就可以看到C文件中出現(xiàn)的initialize_bomb函數(shù),然后就到了phase_1函數(shù),我們可以推測這個(gè)函數(shù)就是判斷是否通過的核心函數(shù)。

這時(shí)候就要用到gdb的指令了,在匯編模式下的指令與普通模式有一些不同。我們可以使用ni(next instruction)和si(step into)來實(shí)現(xiàn)普通模式下的單步向下執(zhí)行與步入操作。

打斷點(diǎn)需要使用b <func_name>b *<address>來進(jìn)行比如我們可以看到調(diào)用phase_1函數(shù)的call指令的地址是0x400e3a,所以我們可以使用b phase_1b *0x400e3a來打斷點(diǎn)的,這兩條命令有一點(diǎn)不同就在于斷在地址會停在地址 上也就是call指令的位置,斷在函數(shù)名會進(jìn)入函數(shù)中,相當(dāng)于再進(jìn)行了一次si操作。

斷點(diǎn)停后有可能出現(xiàn)字符重疊的情況,我們可以使用refresh命令刷新界面。

下面把斷點(diǎn)打在phase_1函數(shù)之后就可以使用r命令來運(yùn)行指令了,程序會提示我們輸入字符串,這個(gè)時(shí)候因?yàn)槲覀兇蛄藬帱c(diǎn)不用擔(dān)心炸彈會爆炸,可以隨意輸入。執(zhí)行后程序會停在phase_1函數(shù)的位置,我們可以看到函數(shù)內(nèi)部的情況。

下面就可以根據(jù)函數(shù)內(nèi)部的邏輯來解決炸彈了。

代碼來自objdump -d反匯編出來的代碼,與gdb的匯編模式下看到的代碼是一樣的。

主函數(shù)

主函數(shù)代碼比較長,只貼我們需要分析的關(guān)鍵部分。

  400e32:   e8 67 06 00 00          callq  40149e <read_line>
  400e37:   48 89 c7                mov    %rax,%rdi

第一句調(diào)用了read_line函數(shù),我們可以轉(zhuǎn)到函數(shù)入口地址40149e去查看read_line的代碼(事實(shí)上一開始我也這么做了),但是會發(fā)現(xiàn)代碼中包含了許多對系統(tǒng)庫函數(shù)的調(diào)用,仔細(xì)分析的難度比較大并且沒有必要。從提供的C代碼與函數(shù)名稱,我們可以推測出這個(gè)函數(shù)的作用是讀取一行輸入。根據(jù)返回值一般存放在rax中的約定,rax中應(yīng)該就是讀入的數(shù)據(jù)的地址,第二句中我們把這個(gè)值復(fù)制到了rdi中。

  400e3a:   e8 a1 00 00 00          callq  400ee0 <phase_1>
  400e3f:   e8 80 07 00 00          callq  4015c4 <phase_defused>

接下來兩句分別開始調(diào)用phase_1phase_defused,下面的五個(gè)階段也是上面這樣的模式。

階段一

0000000000400ee0 <phase_1>:
  400ee0:   48 83 ec 08             sub    $0x8,%rsp
  400ee4:   be 00 24 40 00          mov    $0x402400,%esi
  400ee9:   e8 4a 04 00 00          callq  401338 <strings_not_equal>
  400eee:   85 c0                   test   %eax,%eax
  400ef0:   74 05                   je     400ef7 <phase_1+0x17>
  400ef2:   e8 43 05 00 00          callq  40143a <explode_bomb>
  400ef7:   48 83 c4 08             add    $0x8,%rsp
  400efb:   c3                      retq  

階段一的代碼比較短,第二行中把一個(gè)地址給了esi,接下來調(diào)用了strings_not_equal這個(gè)函數(shù),我們可以跳到函數(shù)入口地址查看這個(gè)函數(shù)。

  40133c:   48 89 fb                mov    %rdi,%rbx
  40133f:   48 89 f5                mov    %rsi,%rbp
  401342:   e8 d4 ff ff ff          callq  40131b <string_length>

函數(shù)中這兩行分別把rdi rsi的值復(fù)制到了rbxrbp,然后調(diào)用了string_length,這個(gè)時(shí)候就不用去看string_length函數(shù)了,我們可以直接猜測出rbxrbp就是函數(shù)的參數(shù)。那么可以說明rdi rsi就是給string_not_equal的函數(shù),那么string_not_equal的返回值是什么呢?

看到string_not_equal返回后的5、6兩句,測試了eax的值,在eax等于0時(shí)就跳轉(zhuǎn)到400ef7,如果不為0,那么會繼續(xù)向下執(zhí)行,下面一句是調(diào)用explode_bomb函數(shù),不用說這一定是觸發(fā)炸彈的函數(shù),所以我們需要令string_not_equal的返回值為0,那么從名字判斷,我們需要令兩個(gè)字符串相等,兩個(gè)字符串之前說過存放在rdirsi中,rdi是我們讀入的字符串,而rsi中存放的是400ee4復(fù)制的0x402400,這個(gè)時(shí)候用gdb去查看該地址中存放的字符串比較方便:

bomblab2.png

這串字符就是第一階段的答案。

階段二

  400efc:   55                      push   %rbp
  400efd:   53                      push   %rbx
  400efe:   48 83 ec 28             sub    $0x28,%rsp
  400f02:   48 89 e6                mov    %rsp,%rsi
  400f05:   e8 52 05 00 00          callq  40145c <read_six_numbers>
  400f0a:   83 3c 24 01             cmpl   $0x1,(%rsp)
  400f0e:   74 20                   je     400f30 <phase_2+0x34>
  400f10:   e8 25 05 00 00          callq  40143a <explode_bomb>
  400f15:   eb 19                   jmp    400f30 <phase_2+0x34>
  400f17:   8b 43 fc                mov    -0x4(%rbx),%eax
  400f1a:   01 c0                   add    %eax,%eax
  400f1c:   39 03                   cmp    %eax,(%rbx)
  400f1e:   74 05                   je     400f25 <phase_2+0x29>
  400f20:   e8 15 05 00 00          callq  40143a <explode_bomb>
  400f25:   48 83 c3 04             add    $0x4,%rbx
  400f29:   48 39 eb                cmp    %rbp,%rbx
  400f2c:   75 e9                   jne    400f17 <phase_2+0x1b>
  400f2e:   eb 0c                   jmp    400f3c <phase_2+0x40>
  400f30:   48 8d 5c 24 04          lea    0x4(%rsp),%rbx
  400f35:   48 8d 6c 24 18          lea    0x18(%rsp),%rbp
  400f3a:   eb db                   jmp    400f17 <phase_2+0x1b>
  400f3c:   48 83 c4 28             add    $0x28,%rsp
  400f40:   5b                      pop    %rbx
  400f41:   5d                      pop    %rbp
  400f42:   c3                      retq  

進(jìn)入phase_2函數(shù),觀察它的代碼,可以發(fā)現(xiàn)第5行調(diào)用了一個(gè)名為read_six_numbers這個(gè)函數(shù),顧名思義,這個(gè)函數(shù)的作用應(yīng)該是從輸入中讀取6個(gè)數(shù)字,那么問題來了,這6個(gè)數(shù)字是怎么返回的呢?我們注意到第4行中把rsp的值復(fù)制給了rsi,我們可以猜測這個(gè)函數(shù)是使用棧來返回讀入的結(jié)果。

當(dāng)然只是猜測是不行的,我們需要用實(shí)驗(yàn)去驗(yàn)證我們的想法,我們在輸入文件中設(shè)置1 2 3 4 5 6這一行輸入,然后將斷點(diǎn)打在*400f0a這個(gè)函數(shù)剛返回的位置(注意輸入中應(yīng)該含有第一階段的答案,不然炸彈就炸在第一階段了)。運(yùn)行停在斷點(diǎn)之后查看棧中的內(nèi)容:

bomblab3.png

我們打出了rsp開始32字節(jié)的內(nèi)容,發(fā)現(xiàn)棧中依次存放了輸入的6個(gè)數(shù),之后就是返回的地址。那么我們可以確定讀取的數(shù)值就是依次存放在棧中的。

接下來看第6、7、8行,它將rsp中存放的值與1進(jìn)行比較,如果相等則跳過第8行的引爆代碼,說明我們需要輸入的第一個(gè)數(shù)為1 。再看跳轉(zhuǎn)到的位置(19、20行)將rsp+0x4rsp+0x18的值分別存放到了rbxrbp。下一行又進(jìn)行了一次跳轉(zhuǎn),來到了第10行,第10行將rbx的地址減4中存放的內(nèi)容復(fù)制到了eax中,rbx的地址減4也就意味著與rsp相等,它的值也就是第一個(gè)讀入的值。下一行將eax的值乘二,接下來將乘二后的值與rbx也就是第二個(gè)值進(jìn)行比較,如果相同則跳過引爆代碼。上面這一系列操作總結(jié)起來就是如果第二個(gè)值是第一個(gè)值的兩倍則不引爆。

再往下就是把rbx的值加上4,因?yàn)橐粋€(gè)int占4個(gè)字節(jié),也就是把rbx指向了下一個(gè)讀入的值。下一步將rbxrbp的值進(jìn)行比較,回想rbp的值為的rsp+0x18也就是 rsp+24,指向6個(gè)int值之后的位置,所以與它進(jìn)行比較就是判斷是否到達(dá)臨界條件。如果沒有到達(dá)臨界條件,則跳到上一段中比較的部分繼承進(jìn)行??吹竭@里,我們已經(jīng)可以判斷出phase_2的要求是讀入的6個(gè)數(shù)第一個(gè)數(shù)必為1,而后面的數(shù)字都是前面一個(gè)數(shù)字的兩倍。

所以階段2的答案為1 2 3 4 5 6.

階段三

階段三的代碼比較長,我們分開來看:

0000000000400f43 <phase_3>:
  400f43:   48 83 ec 18             sub    $0x18,%rsp
  400f47:   48 8d 4c 24 0c          lea    0xc(%rsp),%rcx
  400f4c:   48 8d 54 24 08          lea    0x8(%rsp),%rdx
  400f51:   be cf 25 40 00          mov    $0x4025cf,%esi
  400f56:   b8 00 00 00 00          mov    $0x0,%eax
  400f5b:   e8 90 fc ff ff          callq  400bf0 <__isoc99_sscanf@plt>
  400f60:   83 f8 01                cmp    $0x1,%eax
  400f63:   7f 05                   jg     400f6a <phase_3+0x27>
  400f65:   e8 d0 04 00 00          callq  40143a <explode_bomb>
  400f6a:   83 7c 24 08 07          cmpl   $0x7,0x8(%rsp)
  400f6f:   77 3c                   ja     400fad <phase_3+0x6a>
  400f71:   8b 44 24 08             mov    0x8(%rsp),%eax
  400f75:   ff 24 c5 70 24 40 00    jmpq   *0x402470(,%rax,8)

第3、4兩行將rsp+0xcrsp+0x8的值分別給rcxrdx,下一行將一個(gè)地址值復(fù)制給了esi,接著將eax置為0,下一步調(diào)用了庫函數(shù)sscanf,我們想到sscanf中的參數(shù)中需要一個(gè)格式化字符串,那么esi中的這個(gè)地址值就很有可能存放了這個(gè)字符串,我們同樣使用gdb在運(yùn)行時(shí)查看這個(gè)字符串:

bomblab4.png

可以看到這就是格式化字符串,讀入的是兩個(gè)整型值。這兩個(gè)值存放在哪里呢?我們想到之前把rsp+0xcrsp+0x8的值分別給rcxrdx,這是兩個(gè)地址值,我們可以用之前的方法驗(yàn)證棧中存放的確實(shí)是我們讀入的這兩個(gè)值。

下面第8行將eax與1進(jìn)行比較,eax一般用于存放函數(shù)返回值,而sscanf 的返回值是成功讀入的數(shù)值個(gè)數(shù),也就是說這幾行將成功讀入的個(gè)數(shù)與1進(jìn)行比較,如果大于1則跳過引爆的代碼。

下面第11行將rsp+0x8中存放的值與0x7進(jìn)行比較,如果大于0x7則跳到400fad的位置,我們看這個(gè)地址的指令:

  400fad:   e8 88 04 00 00          callq  40143a <explode_bomb>

引爆炸彈。

下面的兩行比較關(guān)鍵:第13行將rsp+0x8中存放的值復(fù)制入eax,第14行進(jìn)行一個(gè)跳轉(zhuǎn),跳轉(zhuǎn)到的地址為0x402470(,%rax,8),這就是一個(gè)典型的switch語句的實(shí)現(xiàn):直接跳轉(zhuǎn)到索引*位移的指令位置。

  x = 0
  400f7c:   b8 cf 00 00 00          mov    $0xcf,%eax
  400f81:   eb 3b                   jmp    400fbe <phase_3+0x7b>
  x = 2
  400f83:   b8 c3 02 00 00          mov    $0x2c3,%eax
  400f88:   eb 34                   jmp    400fbe <phase_3+0x7b>
  x = 3
  400f8a:   b8 00 01 00 00          mov    $0x100,%eax
  400f8f:   eb 2d                   jmp    400fbe <phase_3+0x7b>
  x = 4
  400f91:   b8 85 01 00 00          mov    $0x185,%eax
  400f96:   eb 26                   jmp    400fbe <phase_3+0x7b>
  x = 5
  400f98:   b8 ce 00 00 00          mov    $0xce,%eax
  400f9d:   eb 1f                   jmp    400fbe <phase_3+0x7b>
  x = 6
  400f9f:   b8 aa 02 00 00          mov    $0x2aa,%eax
  400fa4:   eb 18                   jmp    400fbe <phase_3+0x7b>
  x = 7
  400fa6:   b8 47 01 00 00          mov    $0x147,%eax
  400fab:   eb 11                   jmp    400fbe <phase_3+0x7b>

  400fad:   e8 88 04 00 00          callq  40143a <explode_bomb>
  400fb2:   b8 00 00 00 00          mov    $0x0,%eax
  400fb7:   eb 05                   jmp    400fbe <phase_3+0x7b>
  x = 1
  400fb9:   b8 37 01 00 00          mov    $0x137,%eax
  400fbe:   3b 44 24 0c             cmp    0xc(%rsp),%eax
  400fc2:   74 05                   je     400fc9 <phase_3+0x86>
  
  400fc4:   e8 71 04 00 00          callq  40143a <explode_bomb>
  400fc9:   48 83 c4 18             add    $0x18,%rsp
  400fcd:   c3                      retq   

上面的代碼已經(jīng)加了注釋,假設(shè)讀入的第一個(gè)數(shù)為x,看到所有分支最后都跳轉(zhuǎn)到了400fbe這行判斷中,將eax中的值與rsp+0xc也就是我們讀入的第二個(gè)數(shù)進(jìn)行判斷,如果相等的話跳過引爆代碼。

而每個(gè)分支都將一個(gè)數(shù)復(fù)制到了eax中,也就是說我們只要根據(jù)不同的第一個(gè)參數(shù)的值讀入對應(yīng)的第二個(gè)參數(shù)就可以了,所以我們可以隨意選擇一個(gè)x值,這里我選擇x=1,對應(yīng)的第二個(gè)參數(shù)為0x137換成十進(jìn)制是311,所以第3階段的(一個(gè))答案為:

1 311

階段四

000000000040100c <phase_4>:
  40100c:   48 83 ec 18             sub    $0x18,%rsp
  401010:   48 8d 4c 24 0c          lea    0xc(%rsp),%rcx
  401015:   48 8d 54 24 08          lea    0x8(%rsp),%rdx
  40101a:   be cf 25 40 00          mov    $0x4025cf,%esi
  40101f:   b8 00 00 00 00          mov    $0x0,%eax
  401024:   e8 c7 fb ff ff          callq  400bf0 <__isoc99_sscanf@plt>
  401029:   83 f8 02                cmp    $0x2,%eax
  40102c:   75 07                   jne    401035 <phase_4+0x29>
  40102e:   83 7c 24 08 0e          cmpl   $0xe,0x8(%rsp)
  401033:   76 05                   jbe    40103a <phase_4+0x2e>
  401035:   e8 00 04 00 00          callq  40143a <explode_bomb>
  40103a:   ba 0e 00 00 00          mov    $0xe,%edx
  40103f:   be 00 00 00 00          mov    $0x0,%esi
  401044:   8b 7c 24 08             mov    0x8(%rsp),%edi
  401048:   e8 81 ff ff ff          callq  400fce <func4>
  40104d:   85 c0                   test   %eax,%eax
  40104f:   75 07                   jne    401058 <phase_4+0x4c> 

前面的代碼比較熟悉,同樣是調(diào)用了sscanf函數(shù),我們查看格式字符串:

bomblab5.png

也是讀入兩個(gè)參數(shù)存放在rcxrdx中。

同樣對讀入?yún)?shù)的個(gè)數(shù)進(jìn)行了判斷,要求成功讀入?yún)?shù)的個(gè)數(shù)等于兩個(gè),第11、12行要求輸入的第一個(gè)參數(shù)小于0xe

接下來把0xe賦給edx、0x0賦給esi,rsp+0x8的值賦給edi。接下來調(diào)用了func4函數(shù)。

在去查看func4函數(shù)的代碼之前,我們先查看函數(shù)返回后的代碼,了解我們需要的結(jié)果。第17、18行測試了eax的值如果不為0,就跳轉(zhuǎn)到引爆代碼。

所以我們的目標(biāo)是返回時(shí)eax的值為0.下面進(jìn)入func4函數(shù)。

0000000000400fce <func4>:
  400fce:   48 83 ec 08             sub    $0x8,%rsp
  400fd2:   89 d0                   mov    %edx,%eax
  400fd4:   29 f0                   sub    %esi,%eax
  400fd6:   89 c1                   mov    %eax,%ecx
  400fd8:   c1 e9 1f                shr    $0x1f,%ecx
  400fdb:   01 c8                   add    %ecx,%eax
  400fdd:   d1 f8                   sar    %eax
  400fdf:   8d 0c 30                lea    (%rax,%rsi,1),%ecx
  400fe2:   39 f9                   cmp    %edi,%ecx
  400fe4:   7e 0c                   jle    400ff2 <func4+0x24>
  400fe6:   8d 51 ff                lea    -0x1(%rcx),%edx
  400fe9:   e8 e0 ff ff ff          callq  400fce <func4>
  400fee:   01 c0                   add    %eax,%eax
  400ff0:   eb 15                   jmp    401007 <func4+0x39>
  400ff2:   b8 00 00 00 00          mov    $0x0,%eax
  400ff7:   39 f9                   cmp    %edi,%ecx
  400ff9:   7d 0c                   jge    401007 <func4+0x39>
  400ffb:   8d 71 01                lea    0x1(%rcx),%esi
  400ffe:   e8 cb ff ff ff          callq  400fce <func4>
  401003:   8d 44 00 01             lea    0x1(%rax,%rax,1),%eax
  401007:   48 83 c4 08             add    $0x8,%rsp
  40100b:   c3                      retq    

這段代碼之中我們調(diào)用了func4,這是一個(gè)遞歸的過程,像之間那樣直接分析比較困難,這里我們就將這個(gè)代碼逆向?yàn)镃語言再來分析,下面是逆向出的C語言代碼:

int fun(int a1, int a2, int x){
    int b = (a1 - a2) >> 31;
    int result = ((a1-a2) + b) >> 1;
    b = result + a2;
    if(b == x) return 0;
    if(b < x) {
        result = fun(a1, b + 1, x);
        return result * 2 + 1;
    }else{
        result = fun(b - 1, a2, x);
        return result * 2;
    }
}

這里的a1``a2初始值分別為之前的0xe0x0。我們可以直接寫個(gè)測試程序來跑出能返回0的輸入值:

int main(void){
    for(int i = 0; i <= 0xe; i++){
        if(fun(0xe,0,i) == 0){
            printf("%d\n",i) ;
            return 0;
        }
    }
    return 0; 
}

得出允許的值有0 1 3 7.

回到phase_4的代碼:

  401051:   83 7c 24 0c 00          cmpl   $0x0,0xc(%rsp)
  401056:   74 05                   je     40105d <phase_4+0x51>
  401058:   e8 dd 03 00 00          callq  40143a <explode_bomb>
  40105d:   48 83 c4 18             add    $0x18,%rsp
  401061:   c3                      retq  

第1、2行將輸入的第二個(gè)參數(shù)與0進(jìn)行比較,如果不為0就引爆炸彈。所以輸入的第二個(gè)參數(shù)必為0。

綜上我們得出(一個(gè))答案為:

0 0

階段五

后面的階段難度開始加大,我們分部分進(jìn)行分析:

0000000000401062 <phase_5>:
  401062:   53                      push   %rbx
  401063:   48 83 ec 20             sub    $0x20,%rsp
  401067:   48 89 fb                mov    %rdi,%rbx
  40106a:   64 48 8b 04 25 28 00    mov    %fs:0x28,%rax
  401071:   00 00
  401073:   48 89 44 24 18          mov    %rax,0x18(%rsp)

第4行把輸入的地址rdirbx,第5、7行則是在棧中壓入了一個(gè)哨兵變量。

  401078:   31 c0                   xor    %eax,%eax
  40107a:   e8 9c 02 00 00          callq  40131b <string_length>
  40107f:   83 f8 06                cmp    $0x6,%eax
  401082:   74 4e                   je     4010d2 <phase_5+0x70>
  401084:   e8 b1 03 00 00          callq  40143a <explode_bomb>

第1行清空了eax,第2行中調(diào)用了string_length,我們想到之前的把輸入放入rbx這個(gè)動(dòng)作,可以推測這個(gè)函數(shù)是為了統(tǒng)計(jì)輸入字符的個(gè)數(shù),并存放在了eax中。

下面將eax的值與0x6進(jìn)行比較,等于則進(jìn)行跳轉(zhuǎn)避免引爆炸彈。我們進(jìn)入跳轉(zhuǎn)到的位置:

  4010d2:   b8 00 00 00 00          mov    $0x0,%eax
  4010d7:   eb b2                   jmp    40108b <phase_5+0x29>

eax置為0后進(jìn)行跳轉(zhuǎn)。

繼續(xù)進(jìn)入跳轉(zhuǎn)到的位置:

 40108b:    0f b6 0c 03             movzbl (%rbx,%rax,1),%ecx
  40108f:   88 0c 24                mov    %cl,(%rsp)
  401092:   48 8b 14 24             mov    (%rsp),%rdx
  401096:   83 e2 0f                and    $0xf,%edx
  401099:   0f b6 92 b0 24 40 00    movzbl 0x4024b0(%rdx),%edx
  4010a0:   88 54 04 10             mov    %dl,0x10(%rsp,%rax,1)
  4010a4:   48 83 c0 01             add    $0x1,%rax
  4010a8:   48 83 f8 06             cmp    $0x6,%rax
  4010ac:   75 dd                   jne    40108b <phase_5+0x29>

第1行中movzbl命令將從rbx(輸入)開始的rax位置的一個(gè)字節(jié)賦給ecx的低16位。

接下來的兩行先把cl中的值(上一步得到)復(fù)制到rsp處,再將rsp中的值復(fù)制到rdx中,第4行使用掩碼0xfedx的低4位。到這里我們總結(jié)一下上面的操作:取讀入的字符串中rax位置處的字符,再取它的低4位放在edx中。

下面第5行中,將地址0x4024b0+rdx中的一個(gè)字節(jié)放入edx的低16位中。第6行將這16位復(fù)制到了rsp+0x10+rax的位置中。

接下來把rax加1,我們從前面可以看出來這個(gè)rax起的是一個(gè)索引的作用。第 8行與6進(jìn)行比較,如果不等于6則跳到第1行重復(fù)這個(gè)過程。

在這段之中,循環(huán)一共進(jìn)行了6次,分別讀取了輸入的6個(gè)字符,記錄這個(gè)6個(gè)字符的低6位作為索引rdx,從0x4024b0+rdx的位置復(fù)制一個(gè)字節(jié)到rsp+0x10開始的6字節(jié)中。結(jié)束之后,rsp+0x10開始存放了6個(gè)字符。

  4010ae:   c6 44 24 16 00          movb   $0x0,0x16(%rsp)

接下來一行在rsp+0x16的位置也就是6個(gè)字符之后置上一個(gè)0x0也就是終止符\0。

  4010b3:   be 5e 24 40 00          mov    $0x40245e,%esi
  4010b8:   48 8d 7c 24 10          lea    0x10(%rsp),%rdi
  4010bd:   e8 76 02 00 00          callq  401338 <strings_not_equal>
  4010c2:   85 c0                   test   %eax,%eax
  4010c4:   74 13                   je     4010d9 <phase_5+0x77>
  4010c6:   e8 6f 03 00 00          callq  40143a <explode_bomb>

接下來將0x40245e這個(gè)地址賦給esi,把rsp+0x10這個(gè)地址賦給rdi,接下來調(diào)用strings_not_equal這個(gè)函數(shù),之前的經(jīng)驗(yàn)告訴我們esirdi就是要比較的兩個(gè)字符串的首地址。如果兩個(gè)字符串不相同就引爆炸彈。

我們先看0x40245e位置的字符串:

bomblab6.png

這就是我們應(yīng)該構(gòu)造并存放在rsp+0x10處的字符串。

接下來再查看我們復(fù)制到rsp中的字符來源也就是0x4024b0開始的字符:

bomblab7.png

可以看到我們需要的字符flyers的索引分別為9 15 14 5 6 7。這個(gè)索引就是我們輸入的字符的低4位,那我們只要找到低4位分別是以上數(shù)值的字符就可以了。

所以階段5的(一個(gè))答案為:

ionefg

階段六

階段六可以說是最復(fù)雜的一個(gè)階段,同樣一步步分析:

00000000004010f4 <phase_6>:
  4010f4:   41 56                   push   %r14
  4010f6:   41 55                   push   %r13
  4010f8:   41 54                   push   %r12
  4010fa:   55                      push   %rbp
  4010fb:   53                      push   %rbx
  4010fc:   48 83 ec 50             sub    $0x50,%rsp
  401100:   49 89 e5                mov    %rsp,%r13
  401103:   48 89 e6                mov    %rsp,%rsi
  401106:   e8 51 03 00 00          callq  40145c <read_six_numbers>

讀入6個(gè)數(shù)字,存放位置還是棧中。

  40110b:   49 89 e6                mov    %rsp,%r14
  40110e:   41 bc 00 00 00 00       mov    $0x0,%r12d
  401114:   4c 89 ed                mov    %r13,%rbp
  401117:   41 8b 45 00             mov    0x0(%r13),%eax
  40111b:   83 e8 01                sub    $0x1,%eax
  40111e:   83 f8 05                cmp    $0x5,%eax
  401121:   76 05                   jbe    401128 <phase_6+0x34>
  401123:   e8 12 03 00 00          callq  40143a <explode_bomb>
  401128:   41 83 c4 01             add    $0x1,%r12d
  40112c:   41 83 fc 06             cmp    $0x6,%r12d
  401130:   74 21                   je     401153 <phase_6+0x5f>
  401132:   44 89 e3                mov    %r12d,%ebx
  401135:   48 63 c3                movslq %ebx,%rax
  401138:   8b 04 84                mov    (%rsp,%rax,4),%eax
  40113b:   39 45 00                cmp    %eax,0x0(%rbp)
  40113e:   75 05                   jne    401145 <phase_6+0x51>
  401140:   e8 f5 02 00 00          callq  40143a <explode_bomb>
  401145:   83 c3 01                add    $0x1,%ebx
  401148:   83 fb 05                cmp    $0x5,%ebx
  40114b:   7e e8                   jle    401135 <phase_6+0x41>
  40114d:   49 83 c5 04             add    $0x4,%r13
  401151:   eb c1                   jmp    401114 <phase_6+0x20>

前面是一系列的賦值操作,第5行將eax減1,eax中的值是rsp位置存放的值。第6、7兩行將減一以后的值與5進(jìn)行比較,小于等于5則跳過引爆代碼。也就是說rsp中存放的第一個(gè)數(shù)必須小于等于6.

之前將r12d置為0,第9行中將r12d的值增加1,下一行與6進(jìn)行比較,如果相等則跳入下一個(gè)階段。

第12行中把r12d中的值復(fù)制給了ebx,下一步又賦給了rax,接下來的一行movrsp+rax*4中的值(也就是第rax+1個(gè)讀入的int值)給了eax。

下一步將eax中的值與rbp地址指向的值進(jìn)行比較,如果不相同則跳過引爆代碼。說明這兩個(gè)值需要不同,再接下來將ebx中的值加1,再與5進(jìn)行比較,如果小于等于5則跳到第13行中,更新rax的值,再去從棧中取下一個(gè)新的int值和rbp中的進(jìn)行比較。到這里我們可以看出,從13行到20行相當(dāng)于一個(gè)內(nèi)循環(huán),從r12d開始,到5結(jié)束,不斷地取棧中的值與rbp的值比較,也就是要求rbp之后的值需要與rbp不同。

第21、22行則是外循環(huán),它更新了r13的值,令r13指向下一個(gè)int值。跳到第3行用r13的值更新rbp的值,也就是把比較的對象向后移一個(gè)。同樣要求該值小于等于5。后面再進(jìn)行內(nèi)循環(huán)比較之后的值。

這里我們就可以明白這段代碼的作用:限制讀入的6個(gè)數(shù)必須小于等于6并且互不相等。

  401153:   48 8d 74 24 18          lea    0x18(%rsp),%rsi
  401158:   4c 89 f0                mov    %r14,%rax
  40115b:   b9 07 00 00 00          mov    $0x7,%ecx
  401160:   89 ca                   mov    %ecx,%edx
  401162:   2b 10                   sub    (%rax),%edx
  401164:   89 10                   mov    %edx,(%rax)
  401166:   48 83 c0 04             add    $0x4,%rax
  40116a:   48 39 f0                cmp    %rsi,%rax
  40116d:   75 f1                   jne    401160 <phase_6+0x6c>

第1行中將rsp+0x18的值賦給rsi

第2行將r14的值賦給rax,r14的值是之前保存的rsp

第3行將0x7賦給ecx,第4行又將ecx復(fù)制給edx

下一步將edx減去rax存放的地址指向的值,接下來又將edx的值賦回rax存放的地址指向的值。

第7行將rax的值加4,也就是指向了下一個(gè)int值,接著與之前設(shè)定的rsi進(jìn)行的比較,如果不相等則重復(fù)這個(gè)過程。rsi實(shí)際上指向的是6個(gè)int值之后的位置,作為一個(gè)標(biāo)記使用。

這段代碼總結(jié)起來就是將棧中的6個(gè)值(假設(shè)為x)變?yōu)?-x。

  40116f:   be 00 00 00 00          mov    $0x0,%esi
  401174:   eb 21                   jmp    401197 <phase_6+0xa3>
  401176:   48 8b 52 08             mov    0x8(%rdx),%rdx
  40117a:   83 c0 01                add    $0x1,%eax
  40117d:   39 c8                   cmp    %ecx,%eax
  40117f:   75 f5                   jne    401176 <phase_6+0x82>
  401181:   eb 05                   jmp    401188 <phase_6+0x94>

  401183:   ba d0 32 60 00          mov    $0x6032d0,%edx
  401188:   48 89 54 74 20          mov    %rdx,0x20(%rsp,%rsi,2)
  40118d:   48 83 c6 04             add    $0x4,%rsi
  401191:   48 83 fe 18             cmp    $0x18,%rsi
  401195:   74 14                   je     4011ab <phase_6+0xb7>
  401197:   8b 0c 34                mov    (%rsp,%rsi,1),%ecx
  40119a:   83 f9 01                cmp    $0x1,%ecx
  40119d:   7e e4                   jle    401183 <phase_6+0x8f>

  40119f:   b8 01 00 00 00          mov    $0x1,%eax
  4011a4:   ba d0 32 60 00          mov    $0x6032d0,%edx
  4011a9:   eb cb                   jmp    401176 <phase_6+0x82>

進(jìn)入下一段代碼,一開始先將esi歸零,然后跳到第14行處執(zhí)行。

第14行中從rsp+rsi的位置(也就是棧中我們讀入的位置)取出一個(gè)數(shù)賦給ecx,接下來對取出的這個(gè)值進(jìn)行判斷,如果它小于等于1則跳到第9行處。

我們在這里假設(shè)這個(gè)數(shù)確實(shí)小于等于1。到第9行,將一個(gè)地址值賦給了edx,接下來將edx的值賦給了rsp+2*rsi+0x20的地址指向的值,這里我們可以知道rsi起到的是索引的作用,下面一行將rsi增加4,說明從rsp+0x20開始存放8個(gè)字節(jié)的數(shù)據(jù)。再將rsi的值與0x18作比較,說明整個(gè)過程要進(jìn)行6次。接下來又到了第14行將下一個(gè)int值給rcx。

那么如果rcx的值不小于等于1,繼續(xù)往下走,第18行將0x1賦給eax,19行將0x6032d0這個(gè)地址賦給edx,接下來跳轉(zhuǎn)到了第3行。第3-6行的代碼是一起的,也是理解這個(gè)過程的關(guān)鍵。

首先第3行的命令,把edx+0x8地址指向的值賦給了edx,這步操作一開始比較難以理解,我們需要先看看edx的初始狀態(tài)是什么樣的,使用gdb在運(yùn)行時(shí)查看內(nèi)存:

bomblab8.png

我們可以從這個(gè)信息中看出,其實(shí)它就是一個(gè)鏈表的結(jié)構(gòu),首先名字就是node給了提示,再者每一個(gè)node中偏移8個(gè)字節(jié)中儲存的都是下一個(gè)節(jié)點(diǎn)的地址,那么前面8個(gè)字節(jié)自然就是節(jié)點(diǎn)儲存的數(shù)據(jù)。

我們再回過頭來看第3行的代碼,就不難理解這個(gè)操作就是我們常用的p = p -> next,也就是指向下一個(gè)節(jié)點(diǎn)。

第4行把eax增1,再將eaxecx進(jìn)行比較,如果不等就再跳到第3步指向鏈表下一個(gè)節(jié)點(diǎn),那么可以看出這4行代碼的作用就是從edx這個(gè)初始位置開始向后移動(dòng)ecx-1次,第7行跳過了第9行,把edx賦給了rsp+0x20開始的第rsi個(gè)8字節(jié)的位置。如果rsi達(dá)到0x18則跳出這部分代碼。

我們整理一下這個(gè)過程,其實(shí)就是依次從棧中讀取存放的6個(gè)數(shù)放入rcx,再根據(jù)rcx的值找到鏈表中對應(yīng)的節(jié)點(diǎn),把節(jié)點(diǎn)的地址放入rsp+0x20開始的對應(yīng)位置中。

  4011ab:   48 8b 5c 24 20          mov    0x20(%rsp),%rbx
  4011b0:   48 8d 44 24 28          lea    0x28(%rsp),%rax
  4011b5:   48 8d 74 24 50          lea    0x50(%rsp),%rsi
  4011ba:   48 89 d9                mov    %rbx,%rcx
  4011bd:   48 8b 10                mov    (%rax),%rdx
  4011c0:   48 89 51 08             mov    %rdx,0x8(%rcx)
  4011c4:   48 83 c0 08             add    $0x8,%rax
  4011c8:   48 39 f0                cmp    %rsi,%rax
  4011cb:   74 05                   je     4011d2 <phase_6+0xde>
  4011cd:   48 89 d1                mov    %rdx,%rcx
  4011d0:   eb eb                   jmp    4011bd <phase_6+0xc9>
  4011d2:   48 c7 42 08 00 00 00    movq   $0x0,0x8(%rdx)

這段代碼前三行分別將rsp+0x20地址指向值、rsp+0x28的值、rsp+0x50的值賦給了rbx 、raxrsi。第4行將rbx復(fù)制到rcx中,第5行將raxrsp+0x20)中存放的地址復(fù)制入rdx,第6行將這個(gè)數(shù)據(jù)賦給了rcx(也就是rbx、*(rsp+0x20))節(jié)點(diǎn)的指針域。下一步將rax增加8,指向棧中的下一個(gè)位置。再與rsi這個(gè)臨界地址進(jìn)行比較,如果rax超出末端則跳出這段代碼到第12行的位置。

下面把rdx中存放的地址值賦給rcx,跳轉(zhuǎn)到第5行重復(fù)過程。

仔細(xì)分析,這個(gè)過程其實(shí)就是按照鏈表節(jié)點(diǎn)在棧中的位置重新將鏈表連接起來。

最后跳出的第12行則是把新的表尾的指針域賦為NULL

  4011d9:   00 
  4011da:   bd 05 00 00 00          mov    $0x5,%ebp
  4011df:   48 8b 43 08             mov    0x8(%rbx),%rax
  4011e3:   8b 00                   mov    (%rax),%eax
  4011e5:   39 03                   cmp    %eax,(%rbx)
  4011e7:   7d 05                   jge    4011ee <phase_6+0xfa>
  4011e9:   e8 4c 02 00 00          callq  40143a <explode_bomb>
  4011ee:   48 8b 5b 08             mov    0x8(%rbx),%rbx
  4011f2:   83 ed 01                sub    $0x1,%ebp
  4011f5:   75 e8                   jne    4011df <phase_6+0xeb>
  4011f7:   48 83 c4 50             add    $0x50,%rsp
  4011fb:   5b                      pop    %rbx
  4011fc:   5d                      pop    %rbp
  4011fd:   41 5c                   pop    %r12
  4011ff:   41 5d                   pop    %r13
  401201:   41 5e                   pop    %r14
  401203:   c3                      retq   

第2行將ebp賦上0x5,第三行中rbx的值是之前的rsp+0x20,那么rbx+0x8這個(gè)地址中存放的值就是下一個(gè)節(jié)點(diǎn)的地址,賦給了rax。

第4行將rax代表的節(jié)點(diǎn)的數(shù)據(jù)取出放入eax,再與rbx代表的節(jié)點(diǎn)的數(shù)據(jù)的值的低4位進(jìn)行比較,如果前一個(gè)節(jié)點(diǎn)的數(shù)據(jù)的低4字節(jié)大于等于后一個(gè)節(jié)點(diǎn)的,則跳過引爆代碼。

第8行又是熟悉的操作:使rbx指向下一個(gè)節(jié)點(diǎn)。

第9、10行減小ebp這個(gè)循環(huán)變量再進(jìn)行判斷,保證循環(huán)進(jìn)行5次。

也就是說,我們需要使新的鏈表中前一個(gè)節(jié)點(diǎn)存放的數(shù)據(jù)值的低4字節(jié)都大于后一個(gè)節(jié)點(diǎn)的。

弄清楚了過程,下面就可以開始反推答案了:

先找到正確的鏈表節(jié)點(diǎn)排列,根據(jù)圖:

bomblab8.png

數(shù)據(jù)由大到小的排列依次是3 4 5 6 1 2。

由于有一步x = 7 - x,所以倒推回來的答案應(yīng)該是:

4 3 2 1 6 5

秘密階段

在之前C代碼的暗示以及我們查看匯編代碼的過程中都可以猜測出有一個(gè)秘密階段的存在,secret_phase的代碼就在phase_6后的func7之后。第一個(gè)問題是我們?nèi)绾芜M(jìn)入secret_phase。

這里可以用一個(gè)簡單的方法,直接在反匯編代碼中搜索secret_phase的入口地址,很快就可以發(fā)現(xiàn)在每個(gè)階段的phase_x之后都有一行phase_defused,就在這個(gè)函數(shù)里面存在callq secret_phase的代碼。

我們就開始分析這個(gè)phase_defused

00000000004015c4 <phase_defused>:
  4015c4:   48 83 ec 78             sub    $0x78,%rsp
  4015c8:   64 48 8b 04 25 28 00    mov    %fs:0x28,%rax
  4015cf:   00 00 
  4015d1:   48 89 44 24 68          mov    %rax,0x68(%rsp)
  4015d6:   31 c0                   xor    %eax,%eax
  4015d8:   83 3d 81 21 20 00 06    cmpl   $0x6,0x202181(%rip)        # 603760 <num_input_strings>
  4015df:   75 5e                   jne    40163f <phase_defused+0x7b>
  4015e1:   4c 8d 44 24 10          lea    0x10(%rsp),%r8
  4015e6:   48 8d 4c 24 0c          lea    0xc(%rsp),%rcx
  4015eb:   48 8d 54 24 08          lea    0x8(%rsp),%rdx
  4015f0:   be 19 26 40 00          mov    $0x402619,%esi
  4015f5:   bf 70 38 60 00          mov    $0x603870,%edi
  4015fa:   e8 f1 f5 ff ff          callq  400bf0 <__isoc99_sscanf@plt>
  4015ff:   83 f8 03                cmp    $0x3,%eax
  401602:   75 31                   jne    401635 <phase_defused+0x71>
  401604:   be 22 26 40 00          mov    $0x402622,%esi
  401609:   48 8d 7c 24 10          lea    0x10(%rsp),%rdi
  40160e:   e8 25 fd ff ff          callq  401338 <strings_not_equal>
  401613:   85 c0                   test   %eax,%eax
  401615:   75 1e                   jne    401635 <phase_defused+0x71>
  401617:   bf f8 24 40 00          mov    $0x4024f8,%edi
  40161c:   e8 ef f4 ff ff          callq  400b10 <puts@plt>
  401621:   bf 20 25 40 00          mov    $0x402520,%edi
  401626:   e8 e5 f4 ff ff          callq  400b10 <puts@plt>
  40162b:   b8 00 00 00 00          mov    $0x0,%eax
  401630:   e8 0d fc ff ff          callq  401242 <secret_phase>
  401635:   bf 58 25 40 00          mov    $0x402558,%edi
  40163a:   e8 d1 f4 ff ff          callq  400b10 <puts@plt>
  40163f:   48 8b 44 24 68          mov    0x68(%rsp),%rax
  401644:   64 48 33 04 25 28 00    xor    %fs:0x28,%rax
  40164b:   00 00 
  40164d:   74 05                   je     401654 <phase_defused+0x90>
  40164f:   e8 dc f4 ff ff          callq  400b30 <__stack_chk_fail@plt>
  401654:   48 83 c4 78             add    $0x78,%rsp
  401658:   c3                      retq   

可以看到第7行將函數(shù)num_input_strings的返回值與6進(jìn)行比較,如果不等于6則的直接跳過中間代碼到達(dá)最后的結(jié)束部分。

從函數(shù)名我們可以推測這個(gè)函數(shù)的作用的是檢測讀取的字符串的數(shù)量,當(dāng)讀取了6個(gè)字符串時(shí),就不會跳過中間的代碼。我們繼續(xù)看中間的代碼:

第9到14行又是熟悉的sscanf調(diào)用過程,我們已經(jīng)知道esi指向的是格式化字符串的首地址,我們先來查看它的內(nèi)容:

bomblab9.png

讀取兩個(gè)整數(shù)和一個(gè)字符串。

有所不同的是在12行之后又有一行給edi賦上了一個(gè)地址值,我們之前所有階段中edi的值都是來自于我們read_line的地址,想到sscanf 參數(shù)中確實(shí)存在一個(gè)輸入,我們可以推測這個(gè)edi中存放的是我們讀取位置的首地址。

那么我們就可以在運(yùn)行時(shí)查看這個(gè)地址的內(nèi)容,看是從哪里進(jìn)行讀取的:

bomblab10.png

首先符號表告訴我們這段數(shù)據(jù)的名字叫做input_strings也就是我們輸入的字符串,那么這個(gè)地址上的0 0代表的應(yīng)該就是我們的第4行輸入。兩個(gè)整型數(shù)字正好與格式化字符串也是匹配的?,F(xiàn)在我們知道,應(yīng)該在這兩個(gè)0之后再追加一個(gè)字符串作為輸入。

第15、16行對成功輸入的數(shù)據(jù)個(gè)數(shù)進(jìn)行了一個(gè)判斷,如果不為3個(gè)則跳過調(diào)用secret_phase的代碼。

第17-19行是對strings_not_equal的調(diào)用,我們已經(jīng)知道它的兩個(gè)參數(shù)分別是esiedi,esi被賦上了一個(gè)地址值,edi被賦上了esp+0x10,我們可以推測出edi的地址就是指向我們讀入的第三個(gè)字符串的,那么需要比較的對象是什么呢?我們在運(yùn)行時(shí)查看內(nèi)存的內(nèi)容:

bomblab11.png

這就是我們需要的第三個(gè)參數(shù)。

可以看到如果第三個(gè)參數(shù)與上面這個(gè)字符串相同的話就會調(diào)用兩次puts輸出提示信息,然后進(jìn)入secret_phase階段。

0000000000401242 <secret_phase>:
  401242:   53                      push   %rbx
  401243:   e8 56 02 00 00          callq  40149e <read_line>
  401248:   ba 0a 00 00 00          mov    $0xa,%edx
  40124d:   be 00 00 00 00          mov    $0x0,%esi
  401252:   48 89 c7                mov    %rax,%rdi
  401255:   e8 76 f9 ff ff          callq  400bd0 <strtol@plt>
  40125a:   48 89 c3                mov    %rax,%rbx
  40125d:   8d 40 ff                lea    -0x1(%rax),%eax
  401260:   3d e8 03 00 00          cmp    $0x3e8,%eax
  401265:   76 05                   jbe    40126c <secret_phase+0x2a>
  401267:   e8 ce 01 00 00          callq  40143a <explode_bomb>
  40126c:   89 de                   mov    %ebx,%esi
  40126e:   bf f0 30 60 00          mov    $0x6030f0,%edi
  401273:   e8 8c ff ff ff          callq  401204 <fun7>
  401278:   83 f8 02                cmp    $0x2,%eax
  40127b:   74 05                   je     401282 <secret_phase+0x40>
  40127d:   e8 b8 01 00 00          callq  40143a <explode_bomb>
  401282:   bf 38 24 40 00          mov    $0x402438,%edi
  401287:   e8 84 f8 ff ff          callq  400b10 <puts@plt>
  40128c:   e8 33 03 00 00          callq  4015c4 <phase_defused>
  401291:   5b                      pop    %rbx
  401292:   c3                      retq   

可以看到第3行調(diào)用了read_line函數(shù),接著把read_line的返回值賦給了rdi,并調(diào)用了strtol函數(shù),這個(gè)標(biāo)準(zhǔn)庫函數(shù)的作用是把一個(gè)字符串轉(zhuǎn)換成對應(yīng)的長整型數(shù)值。返回值還是存放在rax中,第8行將rax復(fù)制給了rbx,第9行將rax減1賦給eax,第十行與0x3e8進(jìn)行比較,如果這個(gè)值小于等于0x3e8就跳過引爆代碼??吹竭@里我們可以知道我們需要再加入一行數(shù)據(jù),它應(yīng)該是一個(gè)小于等于1001的數(shù)值。

接下來將ebx賦給了esi,也就是我們一開始輸入的rax值。第14行將一個(gè)地址值賦給了edi,15行調(diào)用了fun7函數(shù)。我們還是先往下了解一下我們需要得到的結(jié)果。

函數(shù)返回后令返回值eax0x2做了一個(gè)比較,如果相等則跳過引爆代碼。

所以我們需要返回2。

下面查看fun7的代碼:

0000000000401204 <fun7>:
  401204:   48 83 ec 08             sub    $0x8,%rsp
  401208:   48 85 ff                test   %rdi,%rdi
  40120b:   74 2b                   je     401238 <fun7+0x34>
  40120d:   8b 17                   mov    (%rdi),%edx
  40120f:   39 f2                   cmp    %esi,%edx
  401211:   7e 0d                   jle    401220 <fun7+0x1c>
  401213:   48 8b 7f 08             mov    0x8(%rdi),%rdi
  401217:   e8 e8 ff ff ff          callq  401204 <fun7>
  40121c:   01 c0                   add    %eax,%eax
  40121e:   eb 1d                   jmp    40123d <fun7+0x39>
  401220:   b8 00 00 00 00          mov    $0x0,%eax
  401225:   39 f2                   cmp    %esi,%edx
  401227:   74 14                   je     40123d <fun7+0x39>
  401229:   48 8b 7f 10             mov    0x10(%rdi),%rdi
  40122d:   e8 d2 ff ff ff          callq  401204 <fun7>
  401232:   8d 44 00 01             lea    0x1(%rax,%rax,1),%eax
  401236:   eb 05                   jmp    40123d <fun7+0x39>
  401238:   b8 ff ff ff ff          mov    $0xffffffff,%eax
  40123d:   48 83 c4 08             add    $0x8,%rsp
  401241:   c3                      retq   

第3、4兩行先對我們輸入的這個(gè)數(shù)作一個(gè)判斷,如果等于0直接跳到第19行,返回-1,這顯然不是我們想要的結(jié)果。

第5行將rdi的值讀入到了edx中,第6行則將這個(gè)數(shù)與我們讀入的數(shù)進(jìn)行比較,如果這個(gè)數(shù)小于等于我們讀入的數(shù)就跳至第12行,第12行將eax置0,再進(jìn)行一次相同的比較,如果相等則跳至第20行返回。

如果不等(也就是edx小于我們讀入的數(shù)),則繼續(xù)向下執(zhí)行第15行,這行代碼有些與之前的鏈表跳至下一個(gè)節(jié)點(diǎn)類似,到這里,我們就需要查看一下rdi這個(gè)地址里存放的是怎樣一種數(shù)據(jù)結(jié)構(gòu):

bomblab12.png

仔細(xì)觀察可以發(fā)現(xiàn)這是一個(gè)二叉樹的結(jié)構(gòu),每個(gè)節(jié)點(diǎn)第1個(gè)8字節(jié)存放數(shù)據(jù),第2個(gè)8字節(jié)存放左子樹地址,第3個(gè)8字節(jié)存放右子樹位置。并且命令也有規(guī)律,naba代表層數(shù),b代表從左至右第b個(gè)節(jié)點(diǎn)。

根據(jù)這個(gè)結(jié)構(gòu),我們可以把樹畫出來以便我們進(jìn)行分析。隨意找了個(gè)工具表示一下:

bomblab13.png

下面我們回到代碼,現(xiàn)在我們知道第15行代碼的作用是將rdi移到它的右子樹的位置,接著調(diào)用fun7,在返回后令eax = 2 * rax + 1

如果第6行的比較中樹節(jié)點(diǎn)的值大于我們讀入的數(shù)呢?

代碼會進(jìn)行到第8行,令rdi移到它的左子樹的位置,接下來調(diào)用fun7在返回后令eax = 2 * eax。下面跳至返回處。

總結(jié)上面的過程:edi指向一個(gè)樹的節(jié)點(diǎn),令edi節(jié)點(diǎn)的值與我們讀入的值進(jìn)行比較。

  • 如果兩者相等:返回0
  • 如果前者大于后者:rdi移至左子樹,返回2 * rax
  • 如果后者大于前者:rdi移至右子樹,返回2 * rax + 1

那么我們需要返回2,應(yīng)該在最后一次調(diào)用返回0,倒數(shù)第二次調(diào)用返回2 * rax + 1,第一次調(diào)用返回2 * rax。換句話說,這個(gè)數(shù)應(yīng)該在第三層,比父節(jié)點(diǎn)大且比根結(jié)節(jié)小。觀察上圖,唯一的答案是:

0x16(22)


至此,炸彈全部解除:

bomblab14.png

實(shí)驗(yàn)小結(jié)

整個(gè)實(shí)驗(yàn)包括秘密部分用時(shí)九個(gè)小時(shí),引爆了3次炸彈(一次因?yàn)殄e(cuò)誤的嘗試,兩次因?yàn)閷?code>ni命令錯(cuò)打成n)。

一開始拿到題目的時(shí)候會比較蒙,需要先去學(xué)習(xí)工具的使用與一些編譯的基礎(chǔ)知道(符號表、定址表等等)花費(fèi)了一些時(shí)間。前幾個(gè)階段過于關(guān)注函數(shù)的具體實(shí)現(xiàn)而沒有根據(jù)常識去推測一些明顯函數(shù)的作用花費(fèi)了一些時(shí)間。

前4個(gè)階段都算比較簡單,考查了一些常用結(jié)構(gòu)在匯編中的出現(xiàn)形式。第5、6與秘密階段分別考察了堆、鏈表、二叉樹這三個(gè)數(shù)據(jù)結(jié)構(gòu)在內(nèi)存中的結(jié)構(gòu)與匯編級的使用,受益良多。

這個(gè)實(shí)驗(yàn)需要細(xì)致的分析與大膽的猜測與實(shí)驗(yàn)驗(yàn)證,還需要小心操作,最重要的是耐心,面對非常晦澀的匯編代碼如何一步步地弄清代碼的作用很需要毅力。當(dāng)然也可以通過自己寫出等價(jià)的C代碼來幫助自己理解。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容