前面兩篇文章都有講到編譯與鏈接,但是個人感覺不交散,這里總結(jié)一下:
大家在探索整個流程的時候,盡量不要引入外界的庫,這樣編譯起來會比較順暢。
另外可以通過clang -help來查看clang的相關(guān)指令。
我們現(xiàn)在有一個命令行工程:
int main(int argc, const char * argv[]) {
return 0;
}
我們平時都會用cmd + B來編譯工程;那么這么一步操作究竟做了些什么呢?
- 這個工程中有四步隱藏的操作:
預(yù)處理、編譯、匯編和鏈接。
預(yù)處理
預(yù)處理也被稱作預(yù)編譯(Prepressing)
是將main.m文件編譯成mian.i文件,指令如下:
clang -E main.m -o main.i
處理源代碼中以#開頭的預(yù)編譯指令。規(guī)則如下:
1、#define 刪除,并展開對應(yīng)的宏定義。
2、處理所有的條件預(yù)編譯指令。如#if、#ifdef、#else、#endif。
3、#include & #import 包含的文件遞歸插入到此處。
4、刪除所有的注釋 //、/**/等。
5、添加行號和文件名標(biāo)識。如# 1 "main.m"(編譯調(diào)試會用到)。

image.png
編譯(Compilation)
將main.i文件編譯成main.s文件,指令如下:
clang -S main.i -o main.s
這個過程就是把上面的main.i文件進(jìn)行:詞法分析、語法分析、靜態(tài)分析,優(yōu)化生成相應(yīng)的匯編代碼,最終生成main.s文件。
| 名字 | 解釋 |
|---|---|
詞法分析 |
把源代碼的字符序列分割成一個個token(關(guān)鍵字、表示符、字面量、特殊符號),比如把標(biāo)識符放到符號表里面。 |
語法分析 |
生成抽象語法樹AST,此時運(yùn)算符號的優(yōu)先級確定了;有些符號具有多重含義也確定了,比如:*是乘號還是對指針取內(nèi)容;表達(dá)式不合法、括號不匹配等等,都會報錯。 |
靜態(tài)分析 |
分析類型聲明和匹配問題。比如整型和字符串相加,肯定會報錯。 |
中間語法生成 |
CodeGen根據(jù)AST自上向下逐步翻譯成LLVM IR,并且對在編譯期就可以確定的表達(dá)式進(jìn)行優(yōu)化,比如代碼里面的a=1+3,可以優(yōu)化成a=4。(假如開啟了bitcode) |
目標(biāo)代碼生成與優(yōu)化 |
根據(jù)中間語法生成依賴具體機(jī)器的匯編語言;并優(yōu)化匯編語言。這個過程中,假如有變量且定義在同一個編譯單元里,那么就給這個變量分配空間,確定變量的地址。假如變量或者函數(shù)不定義在這個編譯單元里面,那就等到鏈接的時候才能確定地址。 |

image.png
匯編(Assembly)
將main.s文件編譯成main.o文件(也就是我們常說的目標(biāo)文件),指令如下
clang -c main.s -o main.o
這個過程就是把上面得到的main.s文件里面的匯編指令翻譯成機(jī)器指令,最終生成等到main.o

image.png
鏈接(Linking)
這個過程就是將main.o編譯成對應(yīng)的Mach-O文件,也就是我們常說的可執(zhí)行文件,指令如下:
clang main.o -o main

image.png
我們之前講過:鏈接的本質(zhì)就是把一個或多個目標(biāo)文件和需要的庫(靜態(tài)庫/動態(tài)庫,如果需要的話)組合成一個文件(
Mach-O可執(zhí)行文件)
那么以上就是編譯與鏈接的整個過程。