1. 簡介
在C語言中可以使用printf進行格式化輸出,函數(shù)聲明如下:
int __cdecl printf(const char * _Format, ...);
其中第一個參數(shù)format代表需要格式化的字符串,第二個參數(shù)...代表任意個參數(shù)的集合,在C語言中叫做可變參數(shù),使用它聲明的函數(shù)可以在調(diào)用該函數(shù)的時候傳入任意多的參數(shù)。
具體是如何實現(xiàn)的?
2. 實現(xiàn)原理
假如現(xiàn)在要實現(xiàn)printf函數(shù),首先要定義該函數(shù)的實現(xiàn)。
int __cdecl custom_printf(const char * _format, ...)
{
//具體代碼邏輯
}
這里我們不關(guān)心該函數(shù)邏輯是如何實現(xiàn)的,只關(guān)心在函數(shù)內(nèi)部是如何獲取通過...傳入的參數(shù)。
函數(shù)代碼本質(zhì)上就是一段機器指令,為了了解本質(zhì),可以使用vs2008調(diào)試界面的匯編功能進行分析:
int main()
{
custom_printf("test", 1, 3, 4, 5);
return 0;
}
跳轉(zhuǎn)到反匯編進行查看:

在執(zhí)行函數(shù)調(diào)用語句的時候,會先將函數(shù)的參數(shù)進行壓棧(push),接著執(zhí)行函數(shù)內(nèi)部的邏輯代碼(call)。
注意壓棧順序,參數(shù)從右向左依次入棧,這是由
__cdecl決定的。
接著查看一下函數(shù)的匯編代碼:

目前custom_printf內(nèi)部沒有任何代碼,生成的匯編代碼和main函數(shù)的前面完全一致。當然其實在這里我們無需知道代碼本身的含義,只需要知道如何拿到函數(shù)調(diào)用參數(shù)的值即可。
想要拿到函數(shù)參數(shù)的值是非常簡單的,因為在執(zhí)行call之前,參數(shù)已經(jīng)被保存到棧,現(xiàn)在只需要到相應(yīng)的位置拿即可,而_format參數(shù)的地址正是我們要找的參數(shù)位置的最后面。
這可能就是為什么可變參數(shù)之前要有固定參數(shù)的原因吧……
當前棧中的參數(shù)布局如下:
+-------------------+
| 5 address | 高
+-------------------+
| 4 address |
+-------------------+
| 3 address |
+-------------------+
| 1 address | 低
+-------------------+
| test address | <----- 已知條件
+-------------------+
因為x86機器的棧是由高到低增長,所以
test在最下面。
如果想要獲取format以外的其他參數(shù),結(jié)果很簡單,只要將指針按照參數(shù)類型增加。案例代碼實現(xiàn)如下:
int __cdecl custom_printf(const char * _format, ...)
{
int i = 0;
int param[4] = {0};
int *p = &_format;
p += 1; //跳過字符串指針
for(i = 0; i<4; i++) {
param[i] = *(p + i);
}
}
param數(shù)組內(nèi)部就是傳入的參數(shù)。
3. 驗證
查看C語言內(nèi)部提供的操作可變參數(shù)的函數(shù),發(fā)現(xiàn)其實原理就是如此。
#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )
#define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define _crt_va_end(ap) ( ap = (va_list)0 )