WebAssembly 二進(jìn)制編碼介紹(九)

WebAssembly 是基于棧式虛擬機的虛擬二進(jìn)制指令集(V-ISA),它被設(shè)計為高級編程語言的可移植編譯目標(biāo)。長安鏈?zhǔn)褂玫氖莣asm的二進(jìn)制模塊,我們這里著重分析WebAssembly的二進(jìn)制模塊。WebAssembly的各組件含義及關(guān)聯(lián)關(guān)系需要一段時間的學(xué)習(xí)來掌握,需要大家自己不斷的研究與琢磨。

WebAssembly的官方介紹: https://www.wasm.com.cn/docs/binary-encoding/

wasm的二進(jìn)制模塊包含11大組件:


二進(jìn)制模塊組件.png

官方文檔中提供解析wasm二進(jìn)制的方式:

  1. magic & version
    magic - uint32 - 0x6d736100
    version - uint32 - 0x1
  2. 根據(jù)不同的sec type 分別解析


    section信息.png
  3. 各section有詳細(xì)字段說明


    section字段描述.png
  4. 在官方文檔描述中,字段類型uint32、int32比較好理解4字節(jié)。但varuintN、varintN并未見過,這是LEB128編碼格式,具體解碼方式可參考下述代碼
func DecodeUint32(r io.Reader) (ret uint32, num uint64, err error) {
    const (
        uint32Mask  uint32 = 1 << 7
        uint32Mask2        = ^uint32Mask
    )

    for shift := 0; shift < 35; shift += 7 {
        b, err := readByteAsUint32(r)
        if err != nil {
            return 0, 0, fmt.Errorf("readByte failed: %w", err)
        }
        num++
        ret |= (b & uint32Mask2) << shift
        if b&uint32Mask == 0 {
            break
        }
    }
    return
}
  1. 我們以長安鏈官方合約(鏡像chainmaker-go-contract:1.1.1中的合約為例)進(jìn)行解析。
5.1)執(zhí)行hexdump main.wasm > main.dump命令以二進(jìn)制形式查看。使用sublime等編輯工具打開。
hex.png
5.2)magic & version

a) 開始00 61 73 6d四個字節(jié)表示magic,二進(jìn)制使用的是小端方式編碼(大小端的含義還需要自行百度學(xué)習(xí)),實際為:0x6d736100
b) 隨后01 00 00 00四個字節(jié)表示version,0x01

5.3)Type Section

該組件定義了函數(shù)的簽名聲明信息,定義函數(shù)的入?yún)ⅰ⒎祷刂祩€數(shù)及類型。解析如下:

a) 隨后一個字節(jié)01表示下面的section為Type Section
b) 隨后varuint32類型73一個字節(jié),表示該section的長度,通常在處理的時候會忽略該字段,除非session的id 為0。
c)隨后12表示后面有18個type要描述(12是16進(jìn)制)。
d) 隨后60作為每個type的分割符,隨后01表示一個形參,隨后7f 表示該形參的類型為i32。
e)隨后00表示函數(shù)返回值為0個。
f)重復(fù)d,e流程,直到遍歷18個type

5.4)Function Section

該組件包含指向Type Section的Index,F(xiàn)unction Section是數(shù)組結(jié)構(gòu),數(shù)組下標(biāo)與Code Section組件一一對應(yīng),Index表示執(zhí)行Type Section的函數(shù)簽名。

5.5)Code Section

該組件包含函數(shù)具體的實現(xiàn)邏輯以及本地變量信息,Code Section是一個數(shù)組,大小與Function Section相對應(yīng)。

5.6)Export Section

該組件描述的是外部可訪問的內(nèi)存、變量、方法等。以方法組件為例,每個Export Section元素會關(guān)聯(lián)一個Index,該Index指向Code Section。當(dāng)外部調(diào)用某method,可以先在export區(qū)找到匹配的method,在通過export的index,找到要執(zhí)行的字節(jié)碼,然后裝載執(zhí)行。

5.7)Data Section

該組件描述對線性的memory進(jìn)行數(shù)據(jù)初始化,組件記錄數(shù)據(jù)信息以及要初始化的位置信息。

5.8)Memory Section

該組件描述程序內(nèi)存塊數(shù)量以及最大、最小值等。

wasm二進(jìn)制執(zhí)行流程可以參照:https://github.com/mathetake/gasm.git,學(xué)習(xí)字節(jié)碼的解析流程。長安鏈基于該開源代碼進(jìn)行bug修復(fù),描述在 chainmaker-go/module/vm/gasm/README.md。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容