借匯編之力窺探String背后的數(shù)據(jù)結(jié)構(gòu)奧秘

熟悉C++、JAVA、VB等編程語言的朋友都知道String(字符串),它是編程語言中表示文本的數(shù)據(jù)類型,字符串由若干字符組成的,是所有編程語?中?常重要的成員。可能很多朋友平時(shí)只是使用它,沒有仔細(xì)研究其中的奧秘。其實(shí),字符串還是有很多值得我們深入研究的地方。

一、思考

在Swift開發(fā)使用字符串的過程中,你是否有思考過以下問題?

- 1個(gè)字符串變量占用多少內(nèi)存?

-字符串 str1、str2 的底層存儲(chǔ)有什么不同?

-如果對(duì) str1、str2 進(jìn)行拼接操作,str1、str2 的底層存儲(chǔ)又會(huì)發(fā)生什么變化?

如果你能準(zhǔn)確地回答以上問題,那說明對(duì)Swift字符串的底層存儲(chǔ)機(jī)制還是比較了解的。

二、1個(gè)字符串變量占用多少內(nèi)存?

方法1:MemoryLayout

首先,可以借助Swift自帶的 MemoryLayout 來測(cè)試一下

方法2:匯編

另外,我們也可以借助一個(gè)強(qiáng)有力的底層分析助手—匯編語言,來窺探一下String 的底層存儲(chǔ)

-實(shí)際上分析其他語法、系統(tǒng)庫(kù)的底層,都可以借助匯編語言

-比如多態(tài)的原理、泛型的原理、Array 的底層、枚舉的底層等等

-

另外,不僅僅是Swift,C、C++、OC 的底層分析,依然可以借助匯編語言

-畢竟你寫的每一行有效代碼,最終都是要轉(zhuǎn)成機(jī)器指令(0 和 1)

-而機(jī)器指令是跟匯編指令一一對(duì)應(yīng)的,每一條機(jī)器指令都能翻譯成與之對(duì)應(yīng)的匯編指令

-能讀懂匯編指令,就相當(dāng)于能讀懂機(jī)器指令,知道 CPU 具體在干嘛(操作了什么寄存器,操作了哪塊內(nèi)存)

-本教程的代碼是直接跑在 Mac 的命令行(CommandLineTools)項(xiàng)目上

-因此展示的匯編代碼是基于 X64 的 AT&T 格式匯編,并非 iOS 真機(jī)設(shè)備的 ARM 匯編

-其實(shí)不同種類的匯編之間有極大的相似性,只是有些指令的叫法不一樣

跟微軟的Visual Studio一樣,Xcode 也內(nèi)置了非常方便的反匯編功能,可以輕松查看每一句代碼對(duì)應(yīng)的匯編指令,打開反匯編界面的步驟如下

-在某一行需要調(diào)試的代碼打上斷點(diǎn)(反匯編界面會(huì)在斷點(diǎn)調(diào)試狀態(tài)下顯示出來)

-菜單:`Debug` > `Debug Workflow` > `Always Show Disassembly`

- `Assembly`譯為匯編, `Disassembly` 譯為反匯編

-運(yùn)行程序,看到反匯編界面

如果你的反匯編經(jīng)驗(yàn)十足,根據(jù)第16、17 行的匯編就可以推敲出來,String 是占用 16 個(gè)字節(jié)

-因?yàn)樗昧?rax、rdx 寄存器存放字符串 str 的內(nèi)容,而 rax、rdx 都是 8 字節(jié)的

匯編的內(nèi)容太多了,因?yàn)闀r(shí)間和篇幅關(guān)系,文章里并不會(huì)對(duì)每一句匯編指令進(jìn)行詳細(xì)地講解,更多的是想說明匯編的重要性。

三、字符串的底層存儲(chǔ)

窺探內(nèi)存

此前我寫了個(gè)可以窺探Swift變量?jī)?nèi)存的小工具:https://github.com/CoderMJLee/Mems

-現(xiàn)在用它來窺探下字符串的 16 字節(jié)里面,究竟存儲(chǔ)著什么數(shù)據(jù)

- `Mems.memStr(ofVal:)`默認(rèn)情況下按照 8 個(gè)字節(jié)一組來顯示內(nèi)存數(shù)據(jù)

-傳遞參數(shù) `alignment: .one` 是按照 1 個(gè)字節(jié)一組來顯示內(nèi)存數(shù)據(jù)

字符'0'~'9'的 ASCII 值是 0x30~0x39,認(rèn)真觀察最初 str1 的 16 個(gè)字節(jié)數(shù)據(jù),你發(fā)現(xiàn)了什么?

-它直接將所有字符的 ASCII 值存儲(chǔ)在 str1 的 16 字節(jié)中

-最后 1 個(gè)字節(jié) 0xea 中的 0xa 就是字符的數(shù)量,也是共 10 個(gè)字符

拼接

可以發(fā)現(xiàn),當(dāng)對(duì)str1進(jìn)行拼接 "ABCDE" 的時(shí)候

-它最終是將 "0123456789ABCDE"十五個(gè)字符的 ASCII 值都存儲(chǔ)在了 str1 的 16 字節(jié)中

-最后 1 個(gè)字節(jié) 0xef 中的 0xf 就是字符的數(shù)量,也是共 15 個(gè)字符

-可以看得出來,目前 16 個(gè)字節(jié)已經(jīng)存滿了,那如果再拼接 1 個(gè)字符呢?

可以看到,str1里面存儲(chǔ)的數(shù)據(jù)發(fā)生了非常大的變化,每一個(gè)字符的 ASCII 值不見了,

-那里面的 16 字節(jié)具體是什么含義呢?

-所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?

其他情況

如果一開始初始化的時(shí)候(未拼接之前),字符串的內(nèi)容就是超過15個(gè)字符呢?

相信你能猜到是這個(gè)結(jié)果

-這 16 個(gè)字節(jié)里面并沒有出現(xiàn)任何一個(gè)字符的 ASCII 值

-而且這 16 個(gè)字節(jié)跟 `第27行的str1` 還是有所區(qū)別

-雖然它們的字符串內(nèi)容都是"0123456789ABCDEF"

如果對(duì)str2進(jìn)行拼接操作

不難發(fā)現(xiàn):這時(shí)str2的 16 字節(jié)又發(fā)生了變化,跟 `第27行的str1` 是有點(diǎn)相似的

如何解決上述疑問?

上述的種種疑問,光看打印出來的內(nèi)存數(shù)據(jù)是無法解決的,但是都可以利用【?。?!匯編!?。 縼斫鉀Q,分析匯編指令,立馬就得出結(jié)論,因?yàn)槲恼碌钠邢?,平時(shí)工作也比較忙,我把上述問題的詳細(xì)剖析過程錄制成了長(zhǎng)達(dá)2個(gè)多小時(shí)的視頻,有興趣的朋友可以用 1.5~2 倍速度觀看

-鏈接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

-提取碼:kzrk

-視頻對(duì)于沒有匯編基礎(chǔ)的朋友來說,可能會(huì)有點(diǎn)難度,最好挑一個(gè)頭腦清醒的時(shí)間去觀看

-看完視頻后,希望大家能夠確切地感受到匯編語言的重要性,不要永遠(yuǎn)只停留在編寫高級(jí)語言代碼、沉迷于語法糖的層面。

四、最后

我們做的這么多,當(dāng)然不僅僅是為了窺探字符串的底層。同數(shù)據(jù)結(jié)構(gòu)與算法一樣,匯編絕對(duì)是助你程序生涯更進(jìn)一步的必備良方。不僅如此,掌握這些能力,你還能玩轉(zhuǎn)軟件破解、游戲外掛,這是我此前?【匯編\C++】編寫的?個(gè)游戲外掛:https://github.com/CoderMJLee/SeemygoPVZCheat?????er

在編程領(lǐng)域,字符串只是如同茫茫宇宙中的一顆行星,渺小而又偉大。等待我們發(fā)掘探索的東西還有很多。在未來,互聯(lián)網(wǎng)還有更多領(lǐng)域需要編程完成。時(shí)代進(jìn)步,軟件也日新月異的發(fā)展,不學(xué)習(xí)就等于倒退,就會(huì)被時(shí)代淘汰。對(duì)程序員??,唯有不斷的探索學(xué)習(xí)更多技術(shù),才能在這?領(lǐng)域中縱橫遨游。

如果你想提升自己的能力、升職加薪、突破瓶頸,那一定要學(xué)習(xí)更多有關(guān)匯編及數(shù)據(jù)結(jié)構(gòu)與算法等相關(guān)信息。如果想要深入了解,歡迎添加我的微信19950277730,這里不僅有與編程界大牛面對(duì)面的機(jī)會(huì),更有?數(shù)免費(fèi)編程技巧和技術(shù)提升秘籍,我們期待與您共同進(jìn)步。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容