這篇文章繼續(xù)分析C++虛函數(shù)表的內(nèi)容,以及它的工作原理,即用戶代碼如何訪問虛函數(shù)表的內(nèi)容。
下面C++代碼定義了一個(gè)類AAAA,main()函數(shù)new了一個(gè)對(duì)象,然后delete對(duì)象,我們按照調(diào)用順序分析虛函數(shù)表的建立,關(guān)聯(lián)等等操作。
#include <stdio.h>
#include <string>
class AAAA {
private:
long l;
public:
virtual void foo() {}
virtual ~AAAA() {}
};
int main(int argc, char * argv[]) {
AAAA * a = new AAAA();
delete a;
return 0;
}
從main()函數(shù)入口,主要有兩條指令new一個(gè)AAAA對(duì)象,然后刪除這個(gè)對(duì)象。
AAAA * a = new AAAA()
new指令生成的匯編指令如下:
movl $16, %edi
call _Znwm # operator new(unsigned long)
movq %rax, %rbx
movq %rbx, %rax
movq $0, (%rax) #set instance buffer to 0
movq $0, 8(%rax) # set instance buffer to 0
movq %rax, %rdi # move instance pointer to %rdi for calling
call _ZN4AAAAC1Ev # AAAA::AAAA()
主要有個(gè)三塊功能,1. new一個(gè)16字節(jié)的內(nèi)存,2. 內(nèi)存初始化成0,3. 調(diào)用構(gòu)造函數(shù)AAAA::AAAA(),即_ZN4AAAAC1Ev。
我們?cè)倏礃?gòu)造函數(shù)AAAA::AAAA()的代碼:
_ZN4AAAAC1Ev: # AAAA::AAAA()
pushq %rbp
movq %rsp, %rbp
movq %rdi, -8(%rbp)
movq -8(%rbp), %rax
movq $_ZTV4AAAA+16, (%rax)
leave
ret
在C++源代碼里面,我們并沒有為AAAA定義自己的構(gòu)造函數(shù),所以這個(gè)函數(shù)是缺省的構(gòu)造函數(shù),主要功能就一句話,把$_ZTV4AAAA+16的值賦值到對(duì)象實(shí)例的前8個(gè)字節(jié)(movq $_ZTV4AAAA+16, (%rax))。
再來看_ZTV4AAAA+16是個(gè)什么內(nèi)容:
_ZTV4AAAA: # vtable for AAAA
.quad 0
.quad _ZTI4AAAA # typeinfo for AAAA
.quad _ZN4AAAA3fooEv
.quad _ZN4AAAAD1Ev
.quad _ZN4AAAAD0Ev
_ZTS4AAAA: # typeinfo name for AAAA
.string "4AAAA"
_ZTI4AAAA: # typeinfo for AAAA
.quad _ZTVN10__cxxabiv117__class_type_infoE+16
.quad _ZTS4AAAA # typeinfo name for AAAA
上述代碼都有編譯器在翻譯類AAAA的時(shí)候生成。我們看到_ZTV4AAAA是類AAAA的虛函數(shù)表地址,$_ZTV4AAAA+16指向的是虛函數(shù)AAAA:::foo()的地址;我們已經(jīng)知道C++類對(duì)象內(nèi)容的前八個(gè)字節(jié)是指向類虛函數(shù)表的指針,可是此時(shí)我們看到它并不是指向虛函數(shù)表首地址,而是指向首地址+16的一個(gè)偏移,為什么這樣做呢?其實(shí)+16是第一個(gè)虛函數(shù)的地址,前面的16字節(jié)(+8字節(jié)指向類類型信息,+0我也不清楚其用處)保留屬于C++類管理內(nèi)部使用的,對(duì)用戶而言可以隱藏,所以在使用者的角度看來,虛函數(shù)表就是按順序從頭開始排列的(+16偏移開始即可。
總結(jié)一句話,缺省構(gòu)造函數(shù)就是把類的虛函數(shù)表地址寫到類對(duì)象的前面8個(gè)字節(jié)地址。
下面我們看刪除一個(gè)對(duì)象的函數(shù)
delete a;
delete指令生成匯編語言代碼如下:
movq -24(%rbp), %rax
movq (%rax), %rax
addq $16, %rax
movq (%rax), %rdx
movq -24(%rbp), %rax
movq %rax, %rdi
call *%rdx
這段匯編代碼的目的只有一個(gè)就是call到%rdx里面去,完成兩件事,1.給%rdx找到正確的值,2.找到正確的函數(shù)參數(shù)。%rdx需要找到的值是析構(gòu)函數(shù)的地址,參數(shù)當(dāng)然是對(duì)象本身指針了。
從上述代碼我們看到賦給%rdx的值是虛函數(shù)表+16的地址,看前面_ZTV4AAAA的定義,(+16)的地址就是指向第三個(gè)虛函數(shù)的地址,即_ZN4AAAAD0Ev
_ZN4AAAAD0Ev: # AAAA::~AAAA()
pushq %rbp
movq %rsp, %rbp
subq $16, %rsp
movq %rdi, -8(%rbp)
movq -8(%rbp), %rax
movq %rax, %rdi
call _ZN4AAAAD1Ev
movq -8(%rbp), %rax
movq %rax, %rdi
call _ZdlPv
leave
ret
這個(gè)函數(shù)主要功能是調(diào)用另一個(gè)函數(shù) _ZN4AAAAD1Ev
_ZN4AAAAD1Ev: # AAAA::~AAAA()
pushq %rbp
movq %rsp, %rbp
subq $16, %rsp
movq %rdi, -8(%rbp)
movq -8(%rbp), %rax
movq $_ZTV4AAAA+16, (%rax)
movq -8(%rbp), %rax
movq %rax, %rdi
call _ZdlPv
leave
ret
函數(shù)_ZN4AAAAD1Ev是用戶定義的析構(gòu)函數(shù),因?yàn)闆]有具體功能;也不清楚它具體要干什么,只看到最后它調(diào)用了一個(gè)delete函數(shù)。
上述代碼可能比較復(fù)雜啰嗦,但是我們清楚了一個(gè)重要概念,即每一個(gè)多態(tài)類實(shí)例對(duì)象的起始地址都是一個(gè)指向虛函數(shù)表的指針,所有類的虛函數(shù)都在這個(gè)表中占用一列;這個(gè)地址的前面一個(gè)指針指向類的類型信息定義,從而從一個(gè)對(duì)象指針我們就能查到其類類型定義;這也是typeid和dyanmic_cast能夠工作的原理。

最后說明一點(diǎn)在類_ZTV4AAAA的虛函數(shù)表中定義有兩個(gè)析構(gòu)函數(shù),不知道為什么。