之前在別人博客下面看到了一個問題,覺得挺有意思的。但是自己想回答的時候又發(fā)現(xiàn)好像有一些知識點還不是很熟悉,覺得有點迷糊,所以準備再研究一下底層再來回答問題。現(xiàn)在把這個坑填上吧。

OC對象的指針類型
Objective-C是一門動態(tài)語言,而動態(tài)語言是在運行時確定數(shù)據(jù)類型,變量使用之前不需要類型聲明。但是我們在寫代碼的時候還是要給對象一個類型或者使用id的,我自己覺得這么做是為了通過編譯(例如聲明了類型為NSObject的實例sark,卻調(diào)用了方法foo,那么編譯就通不過了)。
實際上動態(tài)語言的一個特性多態(tài)就是這么實現(xiàn)的,即用父類的指針指向子類的實例。
對象的內(nèi)存分布
還是舉個例子會明白一點。需要注意的是需要在模擬器上調(diào)試,在真機調(diào)試會有問題的。
@interface Father : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation ViewController
- (void)foo {
Father *father1 = [Father new];
father1.name = @"001";
id father2 = [Father new];
}
@end
調(diào)試之前,我們要明白幾點常識。在計算機中每個字節(jié)都是有一個地址的,每個字節(jié)有8個bit,每個bit可以存儲1或者0,這8個bit就是這個字節(jié)的值。在小端系統(tǒng)中,低位的值存儲在低地址上。
使用 x 命令調(diào)試。格式:x/<n/f/u> <addr>
- x 顯示內(nèi)存
- n 正整數(shù),表示需要顯示的內(nèi)存單元的個數(shù)
- f 表示addr指向的內(nèi)存內(nèi)容的輸出格式
- s: 對應輸出字符串
- x: 按十六進制格式顯示變量
- d: 按十進制格式顯示變量
- c: 按字符格式顯示變量
- u 以多少個字節(jié)作為一個內(nèi)存單元
- b: 1 byte
- h: 2 bytes
- w: 4 bytes
- g: 8 bytes
打斷點,然后輸入命令: x/8xg father1, 即:以8個字節(jié)為一個單元,從 father1 指針的地址開始起8個單元的值
(lldb) x/8xg father1
0x6000000128f0: 0x000000010be34050 0x000000010bdcc058
Class name
0x600000012900: 0x00006000000128a0 0x0000000100000002
0x600000012910: 0x000000010f8f8e58 0x0000000000000000
0x600000012920: 0x0000000000000000 0x0000000000000000
(lldb) x/8xg father2
0x600000012490: 0x000000010be34050 0x0000000000000000
Class name
0x6000000124a0: 0xbadd2dcdc19dbead 0x00006000000124f0
0x6000000124b0: 0x0000000000000000 0x0000000000000000
0x6000000124c0: 0x00007f8ae3c140c0 0x00006080000092b0
這里我提前將這些地址代表的意思標注好了。
father2雖然是id類型的,但是它跟father1第一個8字節(jié)所存儲的地址是相同的,都是0x000000010be34050。其實這個地址就是 Father類的地址。我們可以使用下面的方法驗證:
(lldb) po (Class)0x000000010be34050
Father
所以一個實例對象第一個8字節(jié)存儲的是這個類的指針,那么后面的字節(jié)存儲的是什么呢?答案是這個實例的成員變量,在上面的例子中我們給實例father1的成員變量name賦值了001, 現(xiàn)在讓我們驗證一下:
(lldb) po (id)0x000000010bdcc058
001
因為我們沒有對father2的成員變量 name 賦值,所以這8個字節(jié)的值是空的。
打開 runtime 750版本源碼,查看 id 和 Class 的定義
typedef struct objc_class *Class;
typedef struct objc_object *id;
struct objc_object {
private:
isa_t isa;
}
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
- id的定義很簡單,是一個指向 objc_object 的指針,而 objc_object 只有一個私有成員變量 isa。objc_class 繼承于 objc_object,所以你也可以用 id 來聲明 Class 的變量,例如
id foo = [NSObject class];。 - isa是一個聯(lián)合體,里面的 struct 在不同架構(gòu)的CPU中定義是不同的。在 64 位CPU中,isa 可以用來存儲更多的信息,例如引用計數(shù),是否有關聯(lián)對象等,可以看我的這篇博客Objective-C引用計數(shù)原理
使用clang rewrite-objc ViewController.m將代碼轉(zhuǎn)化成C++實現(xiàn),可以看到 Father 這個類變成了如下的結(jié)構(gòu)體
struct Father_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
struct NSObject_IMPL {
Class isa;
};
看到這個結(jié)構(gòu)體你是不是就明白了為什么對象的內(nèi)存分布是下圖這個樣子的?
需要注意的是,NSObject 的實例雖然理論上只有8個字節(jié),但是它的實例實際上有 16 個字節(jié),后面8個字節(jié)是空的。

研究到這里,我們就可以回答開頭的那個問題了。
- 指針的類型是id類型,而指針指向的類型可以是別的類。因為 OC 是動態(tài)語言,變量的類型需要在運行時才能夠確定。
- 指針保存的是對象內(nèi)存的首地址
- 64位平臺中,對象首地址開始的8個字節(jié)存儲的是類的指針。也就是通過這個才能確定該類的類型
是不是很簡單!下面繼續(xù)讓我們研究下 Class 的內(nèi)存分布問題
Class的內(nèi)存分布
讓我們繼續(xù)回到之前的代碼調(diào)試。上一節(jié)中我們已經(jīng)知道了Father類的地址了
(lldb) x/16xg 0x000000010be34050
0x10be34050: 0x000000010be34028 0x000000010f8f8e58
meta-class superClass
0x10be34060: 0x00006000000972f0 0x0000000200000003
bucket_t *_buckets _mask _occupied
0x10be34070: 0x0000600000074302 0x000000010f8f8e08
0x10be34080: 0x000000010f8f8e08 0x000000010f548520
0x10be34090: 0x0000000000000000 0x000000010bdd7df0
0x10be340a0: 0x000000010be34078 0x000000010f8f8e58
0x10be340b0: 0x000000010f548520 0x0000000000000000
0x10be340c0: 0x000000010bdd7e38 0x000000010f8f8e08
PS: 注意不要使用真機來調(diào)試,因為我調(diào)試的時候發(fā)現(xiàn)跳不到那個內(nèi)存地址中,但在模擬器中沒這個問題...
配套的我們把 objc_class 的定義放到下面。
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
因為 objc_class 繼承于 objc_object,所以 Class 的第一個8字節(jié)還是 isa 指針,也就是一個指向元類(meta-Class)的指針。如果你不知道元類是什么意思的話就去百度,我也懶得講了。第2個8字節(jié)儲存的是指向父類的指針。先讓我們驗證一下
lldb) po (Class)0x000000010be34028
Father
(lldb) po (Class)0x000000010f8f8e58
NSObject
結(jié)論正確。讓我們接著看cache_t的定義:
struct cache_t {
struct bucket_t *_buckets;
mask_t _mask;
mask_t _occupied;
}
struct bucket_t {
private:
// IMP-first is better for arm64e ptrauth and no worse for arm64.
// SEL-first is better for armv7* and i386 and x86_64.
#if __arm64__
MethodCacheIMP _imp;
cache_key_t _key;
#else
cache_key_t _key;
MethodCacheIMP _imp;
#endif
}
cache_t關系到方法查找的緩存。當對實例發(fā)送消息后,會先到Class的緩存中查找有沒有該方法的緩存,如果有則直接調(diào)用方法的實現(xiàn),提高效率。
大致可以看出,bucket_t是一個哈希表,根據(jù)_key找到其映射的方法實現(xiàn)_imp,而_key就是 SEL(方法的名字 const char *)。cache_t是中的_mask和_occupied是兩個4字節(jié)的變量,應該代表的是緩存的數(shù)量。所以,Class 第三個8字節(jié)存儲的是bucket_t *類型的指針,第4個8字節(jié)保存的是 _mask 和 _occupied。因為是小端,低位地址存儲低位的數(shù)據(jù),所以 _mask 的值是0x00000003,而 _occupied 的值是0x00000002
接下來看 Class 的第3個成員變量class_data_bits_t bits;
struct class_data_bits_t {
// Values are the FAST_ flags above.
uintptr_t bits;
public:
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
}
在64位下,uintptr_t 為8個字節(jié)。class_data_bits_t 的公共方法有很多,主要是配合掩碼進行一些讀寫操作。
繼續(xù)看class_rw_t的定義
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
#if SUPPORT_INDEXED_ISA
uint32_t index;
#endif
};
在結(jié)構(gòu)體中,你可以看到有一個成員變量的類型是class_ro_t,是不是很像class_rw_t。從字面意思上可以猜測,一個是readwriite,一個是readonly。因為 OC 是動態(tài)語言,可以在運行時添加方法和成員變量,運行時添加的方法或者成員變量就是添加到class_rw_t上的,而class_ro_t存儲的是一些編譯后Class的信息。
在class_data_bits_t的定義中,我們知道了需要掩碼FAST_DATA_MASK才能得到 class_rw_t 的地址。下面是 class_rw_t的內(nèi)存分布
// 得到class_rw_t的內(nèi)存地址
0x0000600000074302 & 0x00007ffffffffff8 = 0x600000074300;
(lldb) x/16xg 0x600000074300
0x600000074300: 0x00000000800a0000 0x000000010bdd7da8
flags version ro
0x600000074310: 0x000000010bdd7d18 0x000000010bdd7d90
methods properties
0x600000074320: 0x0000000000000000 0x000000010be33f60
protocols firstSubclass
0x600000074330: 0x000000010ee88c68 0x0000000000000000
nextSiblingClass demangledName
0x600000074340: 0xbadd2dcdc19dbead 0x0000600000074240
因為在代碼中我還聲明了一個 Father 的子類 Son,沒想到在這里出現(xiàn),沒錯,就是這個 firstSubclass。至于如果有多個子類,確定哪個是 firstSubclass 我就不清楚了。。。
(lldb) po (Class)0x000000010be33f60
Son
再來看一下class_ro_t的定義:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
}
然后是它的內(nèi)存分布:
(lldb) x/16xg 0x000000010bdd7da8
0x10bdd7da8: 0x0000000800000184 0x0000000000000010
flags instanceStart instanceSize reserved
0x10bdd7db8: 0x000000010bd3ea79 0x000000010bd3eafc
ivarLayout name
0x10bdd7dc8: 0x000000010bdd7d18 0x0000000000000000
baseMethodList baseProtocols
0x10bdd7dd8: 0x000000010bdd7d68 0x0000000000000000
ivars weakIvarLayout
0x10bdd7de8: 0x000000010bdd7d90 0x0000002800000081
baseProperties
- 可以看到 ro 的成員變量中有
instanceStart和instanceSize。這兩個值的作用是非脆弱成員變量。即如果基類如果增加了成員變量,不需要重新編譯,只需要在初始化系統(tǒng)自動修改instanceStart和instanceSize的值,就能夠繼續(xù)使用子類。具體你可以看我的這篇博客 談Objective-C類成員變量 - ivarLayout 記錄了那些是 storng 的ivar
- name 存儲的是這個類的名字,你可以使用
po (char *)0x000000010bd3eafc打印該名字 - ivars 存儲的是該類的成員變量(不包括關聯(lián)對象)
- weakIvarLayout 記錄了哪一些是 weak 的ivar
還可以看到 ro 的baseMethodList和rw的methods的地址都是0x000000010bdd7d18,ro 的baseProperties和rw的properties的地址都是0x000000010bdd7d90
實際上 rw 的三個成員變量,
methods,properties,protocols的類型都繼承于list_array_tt,這個列表可能有以下3中值:1. 空值 2. 指向列表的指針 3. 指向列表的指針的數(shù)組。所以這就是為什么Class可以在類目中添加方法和協(xié)議,只需要在這個列表數(shù)組中再添加一個指向類目中方法和協(xié)議列表的指針就好了。
因為在這個實例中沒有使用類目添加方法,所以rw中methods數(shù)組僅有一個值,這個值等于ro的baseMethodList。
先來研究methods。
struct method_t {
SEL name;
const char *types;
MethodListIMP imp;
}
struct method_list_t {
uint32_t entsizeAndFlags;
uint32_t count;
method_t first;
}
(lldb) x/16xg 0x000000010bdd7d18
0x10bdd7d18: 0x000000030000001a 0x000000010f547965
entsizeAndFlags count name
0x10bdd7d28: 0x000000010bd41271 0x000000010b7e01e0
types imp
0x10bdd7d38: 0x000000010fd3a28e 0x000000010bd41284
name types
0x10bdd7d48: 0x000000010b7e0180 0x0000000112f11912
imp name
0x10bdd7d58: 0x000000010bd4128c 0x000000010b7e01a0
types imp
0x10bdd7d68: 0x0000000100000020 0x000000010be30c50
0x10bdd7d78: 0x000000010bd19fc8 0x000000010bd4130b
0x10bdd7d88: 0x0000000800000003 0x0000000100000010
entsizeAndFlags 第一個4字節(jié)保存的是 entsize 和標記, entsize 我的理解好像是method_t的長度。第二個4字節(jié)保存的是方法的數(shù)量,在上面的例子中我們可以知道一共保存了3個方法。后面保存了3個method_t的實例,每個實例占用了24個字節(jié)。每個 method_t 實例,第一個8字節(jié)為 sel,即方法名字;第二個8自己保存了方法的參數(shù)類型;第3個8字節(jié)是方法的函數(shù)指針。我們把上面保存的3個方法的信息按順序打印出來
- .cxx_destruct v16@0:8
- name @16@0:8
- setName: v24@0:8@16
第2和第3個方法比較好理解,系統(tǒng)為我們自動生成了屬性 name 的 getter 和 setter 方法。
第1個方法cxx_destruct 的作用是在delloc時釋放該類的成員變量的,具體你可以看這篇博客 探究ARC下dealloc實現(xiàn)
properties 與 methods 類似,因為繼承與同一個結(jié)構(gòu)體。這里簡單分析一下,內(nèi)存分布為 entsizeAndFlags(4字節(jié)), count(4字節(jié)),property_t數(shù)組。property_t里面有兩個成員變量,一個是屬性的名字,一個是屬性的屬性。。。
大致上這就是 Class 的內(nèi)存分布了,下面這張圖能夠簡要的概括了:
