OC底層原理匯總

從內(nèi)存分配開始

在上一篇的流程圖中，我們看到最后的流程中，在_class_createInstanceFromZone，我們分為三步：

1、size = cls->instanceSize(extraBytes);獲取對象需要分配的內(nèi)存大小
2、obj = (id)calloc(1, size);如何申請內(nèi)存
3、obj->initInstanceIsa(cls, hasCxxDtor);初始化isa

這一篇我們來分析獲取需要分配的大小，以及具體如何分配內(nèi)存，也就是我們的第1步和第2步。

分析`instanceSize`函數(shù)的實(shí)現(xiàn)

size_t instanceSize(size_t extraBytes) const {
   if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
       return cache.fastInstanceSize(extraBytes);
   }

   size_t size = alignedInstanceSize() + extraBytes;
   // CF requires all objects be at least 16 bytes.
   if (size < 16) size = 16;
   return size;
}

我們從alignedInstanceSize開始看，這個(gè)方法中

uint32_t alignedInstanceSize() const {
   return word_align(unalignedInstanceSize());
}

這個(gè)方法中的unalignedInstanceSize我們再來看看

uint32_t unalignedInstanceSize() const {
   ASSERT(isRealized());
   return data()->ro()->instanceSize;
}

我們來分析data()->ro()->instanceSize，data()實(shí)現(xiàn)為：

class_rw_t *data() const {
   return bits.data();
}

class_ro_t是類在編譯器存儲類信息的數(shù)據(jù)結(jié)構(gòu)，它里面包含了類的實(shí)例變量、方法列表、協(xié)議列表等，class_rw_t是用來存儲在dyld的_map_images方法中將分類的各種信息與class_ro_t合并后的信息。

data()->ro()->instanceSize也就是獲取對象所有實(shí)例變量需要的存儲大小。

我們再看word_align的實(shí)現(xiàn)

#   define WORD_MASK 7UL
static inline uint32_t word_align(uint32_t x) {
    return (x + WORD_MASK) & ~WORD_MASK;
}

這個(gè)方法先將大小加上7，然后和~WORD_MASK進(jìn)行邏輯與，由于7的二進(jìn)制為0000 1111，對它取反后1111 0000，再與前面進(jìn)行與，那么我們的內(nèi)存分配的大小就是8的倍數(shù)了，也就是8字節(jié)對齊

最后，if (size < 16) size = 16;這一步就是如果不足16字節(jié)，那么我們就補(bǔ)足16，所以一個(gè)OC對象，至少是16個(gè)字節(jié)。

整個(gè)步驟流程如下：

instanceSize流程

獲取內(nèi)存大小的三種方式

我們在OC中獲取內(nèi)存大小的三種方式分別是：

sizeof操作符
- 獲取數(shù)據(jù)的類型占用空間的大小
class_getInstanceSize(Class _Nullable cls)
- 獲取實(shí)例對象中成員變量所需要占用的內(nèi)存大小
malloc_size(const void *ptr)
- 獲取系統(tǒng)實(shí)際分配的內(nèi)存大小

我們創(chuàng)建一個(gè)LWTestClass來測試

@interface LWTestClass : NSObject

@property (nonatomic, copy) NSString *name;
@property (nonatomic, copy) NSString *nickName;
@property (nonatomic, assign) int age;
@property (nonatomic, assign) long height;

@end

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        LWTestClass *person = [LWTestClass alloc];
        person.name      = @"Cooci";
        person.nickName  = @"KC";
        
        NSLog(@"%@ - %lu - %lu - %lu",person,sizeof([LWTestClass class]),class_getInstanceSize([LWTestClass class]),malloc_size((__bridge const void *)(person)));
    }
    return 0;
}

打印結(jié)果：<LGPerson: 0x10044ffc0> - 8 - 40 - 48

如上面的結(jié)果

sizeof中是[LWTestClass class],它是一個(gè)指針，我們指針值是8，所以是8
class_getInstanceSize中獲取的是LWTestClass類的對象中實(shí)例變量所需的大小，我們來分析LWTestClass類結(jié)構(gòu)，isa占8字節(jié)，name8字節(jié)，nickName8字節(jié)，age4字節(jié)補(bǔ)齊到8字節(jié)，height8字節(jié)，所以LWTestClass類只用40字節(jié)就可以保證存儲了。
malloc_size顯示系統(tǒng)分配的內(nèi)存為48字節(jié)，為什么是48字節(jié)呢？我們之前不是看到類的字節(jié)對齊不是8嗎？40也是8的倍數(shù)，為什么不是分配40字節(jié)呢？

為什么是48字節(jié)？

我們在開篇中所說的第一步是獲取對象所需空間大小，這里我們只能確定對象內(nèi)存的內(nèi)存布局是8字節(jié)對齊，這也是class_getInstanceSize獲取到的內(nèi)存大小，malloc_size獲取到的是系統(tǒng)分配的內(nèi)存大小，這是屬于我們第二步中obj = (id)calloc(1, size);的內(nèi)容，calloc方法的分析我們需要用libmalloc源碼，具體的調(diào)用順序我們不一一列舉，大致的調(diào)用過程如以下流程圖與核心代碼。

calloc調(diào)用流程

#define SHIFT_NANO_QUANTUM      4
#define NANO_REGIME_QUANTA_SIZE (1 << SHIFT_NANO_QUANTUM)   // 16


static MALLOC_INLINE size_t
segregated_size_to_fit(nanozone_t *nanozone, size_t size, size_t *pKey)
{
    size_t k, slot_bytes;
   //size為0，補(bǔ)為16
    if (0 == size) {
        size = NANO_REGIME_QUANTA_SIZE; // Historical behavior
    }
    //size加上15再右移4位，將低4位給丟棄
    k = (size + NANO_REGIME_QUANTA_SIZE - 1) >> SHIFT_NANO_QUANTUM; // round up and shift for number of quanta
    //再左移4位，這樣得到的大小就是16的倍數(shù)
    //內(nèi)存分配也就是以16字節(jié)對齊了
    slot_bytes = k << SHIFT_NANO_QUANTUM;                           // multiply by power of two quanta size
    *pKey = k - 1;                                                  // Zero-based!

    return slot_bytes;
}

所以，在前面的例子中，我們計(jì)算出對象所需的內(nèi)存字節(jié)大小為40，進(jìn)行16字節(jié)對齊后，我們實(shí)際分配的內(nèi)存大小為48.

為什么系統(tǒng)分配內(nèi)存要以16字節(jié)對齊

這個(gè)沒找到具體的答案，猜想如下：

一個(gè)對象是一個(gè)struct objc_object的結(jié)構(gòu)體，它至少有一個(gè)成員變量isa，一個(gè)isa占的大小為8字節(jié)
如果我們以8字節(jié)來分配，兩個(gè)連續(xù)的對象在內(nèi)存中就是連續(xù)存儲在一起的，如果我們以內(nèi)存偏移(offset)來訪問的話，如果有一定的錯(cuò)誤，就會訪問到另一個(gè)對象的isa中，這樣會造成一定的不安全性。

這段有想法的大佬希望可以留言給予指導(dǎo)

內(nèi)存對齊

上面我們說內(nèi)存對齊，那么內(nèi)存對齊有什么規(guī)則呢？為什么要內(nèi)存對齊呢？

內(nèi)存對齊規(guī)則

struct/class/union內(nèi)存對齊原則有四個(gè)：

1).數(shù)據(jù)成員對齊規(guī)則：結(jié)構(gòu)(struct)(或聯(lián)合(union))的數(shù)據(jù)成員，第一個(gè)數(shù)據(jù)成員放在offset為0的地方，以后每個(gè)數(shù)據(jù)成員存儲的起始位置要從該成員大小或者成員的子成員大?。ㄖ灰摮蓡T有子成員，比如說是數(shù)組，結(jié)構(gòu)體等）的整數(shù)倍開始(比如int在３２位機(jī)為４字節(jié), 則要從４的整數(shù)倍地址開始存儲),基本類型不包括struct/class/uinon。
2).結(jié)構(gòu)體作為成員:如果一個(gè)結(jié)構(gòu)里有某些結(jié)構(gòu)體成員,則結(jié)構(gòu)體成員要從其內(nèi)部”最寬基本類型成員“的整數(shù)倍地址開始存儲.(struct a里存有struct b,b里有char,int ,double等元素,那b應(yīng)該從8的整數(shù)倍開始存儲.)。
3).收尾工作:結(jié)構(gòu)體的總大小,也就是sizeof的結(jié)果,.必須是其內(nèi)部最大成員的”最寬基本類型成員”的整數(shù)倍.不足的要補(bǔ)齊.(基本類型不包括struct/class/uinon)。
4).sizeof(union)，以結(jié)構(gòu)里面size最大元素為union的size,因?yàn)樵谀骋粫r(shí)刻，union只有一個(gè)成員真正存儲于該地址。

內(nèi)存對齊實(shí)踐

我們設(shè)置3個(gè)結(jié)構(gòu)體，并分別打印它們所占字節(jié)大小

struct TestStruct1{
    double a;
    int b;
    bool c;
    short d;
}st1;

struct TestStruct2{
    int a;
    double b;
    bool c;
    short d;
}st2;

struct TestStruct3{
    int a;
    double b;
    struct TestStruct1 st;
    bool c;
    short d;
}st3;

int main(int argc, const char * argv[]) {

    NSLog(@"st1:%lu,st2:%lu,st3:%lu",sizeof(st1),sizeof(st2),sizeof(st3));
    //打印結(jié)果：st1:16,st2:24,st3:40
    return 0;
}

從結(jié)果可以看到，st1和st2結(jié)構(gòu)體中所含有的數(shù)據(jù)類型與個(gè)數(shù)相同，但位置不同，它們所占的大小也變得不一致了。

下面我們來分析它們分別的內(nèi)存構(gòu)成：

struct TestStruct1

a占8字節(jié)，從0開始，它排在內(nèi)存[0,7]的位置上
b占4字節(jié)，從8開始，8是4的倍數(shù)，符合規(guī)則，所以b存在內(nèi)存[8,11]位置上
c占1字節(jié)，從12開始，12是1的倍數(shù)，符合規(guī)則，所以c存在內(nèi)存12位置上
d占2字節(jié)，從13開始，但是13不是2的倍數(shù)，所以往后到14的位置上，它是2的倍數(shù)，所以d存在內(nèi)存[14,15]位置上
所有成員變量排在[0,15]位置上，它的總大小為16，是最大成員變量double(8字節(jié))的倍數(shù)，所以struct TestStruct1的總大小為16字節(jié)

struct TestStruct2

a占4字節(jié)，從0開始，它排在內(nèi)存[0,3]的位置上
b占8字節(jié)，從4開始，但是4不是8的倍數(shù)，所以往后順排到8開始排，以b存在內(nèi)存[8,15]位置上
c占1字節(jié)，從16開始，16是1的倍數(shù)，符合規(guī)則，所以c存在內(nèi)存16位置上
d占2字節(jié)，從17開始，但是17不是2的倍數(shù)，所以往后到18的位置上，它是2的倍數(shù)，所以d存在內(nèi)存[18,19]位置上
所有成員變量排在[0,19]位置上，它的總大小為20，不是最大成員變量double(8字節(jié))的倍數(shù)，我們在后面補(bǔ)0湊夠24變?yōu)?code>8的倍數(shù)，所以struct TestStruct2的總大小為24字節(jié)

struct TestStruct3

a占4字節(jié)，從0開始，它排在內(nèi)存[0,3]的位置上
b占8字節(jié)，從4開始，但是4不是8的倍數(shù)，所以往后順排到8開始排，以b存在內(nèi)存[8,15]位置上
st是一個(gè)結(jié)構(gòu)體變量，它占16字節(jié)，它內(nèi)部最大的成員變量所占字節(jié)數(shù)為8，st從16開始，它是8的倍數(shù)，符合規(guī)則，所以st排在內(nèi)存[16,31]的位置上
c占1字節(jié)，從32開始，32是1的倍數(shù)，符合規(guī)則，所以c存在內(nèi)存32位置上
d占2字節(jié)，從33開始，但是33不是2的倍數(shù)，所以往后到34的位置上，它是2的倍數(shù)，所以d存在內(nèi)存[34,35]位置上
所有成員變量排在[0,35]位置上，它的總大小為36，不是最大成員變量double和struct TestStruct1(8字節(jié))的倍數(shù)，我們在后面補(bǔ)0湊夠40變?yōu)?code>8的倍數(shù)，所以struct TestStruct2的總大小為40字節(jié)

三個(gè)結(jié)構(gòu)體的內(nèi)部布局如下圖

結(jié)構(gòu)體內(nèi)存構(gòu)成

為什么要內(nèi)存對齊

回答這個(gè)問題，我們要從內(nèi)存、CPU以及平臺三個(gè)方向來回答

1.平臺

移植原因：不是所有的硬件平臺都能訪問任意地址上的任意數(shù)據(jù)的；某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù)，否則拋出硬件異常。

2.CPU原因

CPU位數(shù)就是CPU的數(shù)據(jù)總線寬度，而寬度決定了它的單次數(shù)據(jù)傳送量，比如我們現(xiàn)在iOS平臺一般都是64位，那么64位的CPU一次通電可以傳輸8個(gè)字節(jié)的數(shù)據(jù)，那么我們8個(gè)字節(jié)倍數(shù)的內(nèi)存對齊，可以最大化的節(jié)省CPU傳輸?shù)拇螖?shù)。
在CPU眼里，內(nèi)存是一塊一塊的，塊的大小可以是2、4、8、16字節(jié)大小，因此CPU在讀取內(nèi)存時(shí)是一塊一塊進(jìn)行讀取的，塊大小稱為memory access granulatity，我們將它翻譯為內(nèi)存讀取粒度。
- 假設(shè)CPU要讀取一個(gè)4字節(jié)的int類型數(shù)據(jù)到寄存器中，分兩種情況討論：
  - 1)數(shù)據(jù)從0字節(jié)開始
  - 2)數(shù)據(jù)從1字節(jié)開始
- 假設(shè)內(nèi)存讀取粒度為4
- 當(dāng)從0字節(jié)開始時(shí)，CPU只需要讀取一次即可把這4字節(jié)的數(shù)據(jù)完全讀取到寄存器中
- 當(dāng)該數(shù)據(jù)是從1字節(jié)開始時(shí)，問題變得比較復(fù)雜，此時(shí)該int類型數(shù)據(jù)不是位于內(nèi)存讀取邊界上，那么CPU對它進(jìn)行讀取，要分為兩次讀取
- 此時(shí)CPU先訪問一次內(nèi)存，讀取0-3字節(jié)的數(shù)據(jù)進(jìn)寄存器，并再次讀取4-5字節(jié)的數(shù)據(jù)進(jìn)寄存器，接著把0字節(jié)和6，7，8字節(jié)的數(shù)據(jù)剔除，最后合并1-4字節(jié)的數(shù)據(jù)進(jìn)寄存器。對一個(gè)內(nèi)存未對齊的數(shù)據(jù)進(jìn)行了這么多額外的操作，大大降低了CPU性能。
- 另外，由于平臺原因，有些CPU可能未到邊界即已報(bào)異常。
  
  CPU訪問未對齊數(shù)據(jù)

3.內(nèi)存原因

我們先講講內(nèi)存結(jié)構(gòu)

內(nèi)存的物理構(gòu)造中，一個(gè)內(nèi)存是由若干個(gè)黑色內(nèi)存顆粒構(gòu)成的，每一個(gè)內(nèi)存顆粒叫做一個(gè)chip

內(nèi)存外形圖
每一個(gè)chip內(nèi)部，是由8個(gè)bank組成的

內(nèi)存顆粒物理結(jié)構(gòu)
在每個(gè)bank內(nèi)部，就是電容的行列矩陣結(jié)構(gòu)。(注意，二維矩陣中的一個(gè)元素一般存儲著8個(gè)bit，也就是說包含了8個(gè)小電容)

bank物理結(jié)構(gòu)
8個(gè)同位置的元素，一起組成在內(nèi)存中連續(xù)的64個(gè)bit
通過內(nèi)存的物理結(jié)構(gòu)我們可以看出，內(nèi)存中最小單位就是字節(jié)，操作系統(tǒng)在管理它的時(shí)候，最小單位也就是字節(jié)。另外，通過上述的我們還有一個(gè)額外發(fā)現(xiàn)。那就是在內(nèi)存中連續(xù)的64個(gè)bit，其實(shí)在內(nèi)存的物理結(jié)構(gòu)中，并不連續(xù)。而是分散在同位置的8個(gè)rank上的。
內(nèi)存在進(jìn)行的時(shí)候，一次操作取的就是64bit，所以內(nèi)存對齊最底層的原因是內(nèi)存的IO以64bit為單位進(jìn)行的。對于64位數(shù)據(jù)寬度的內(nèi)存，假如cpu也是64位的cpu（現(xiàn)在的計(jì)算機(jī)基本都是這樣的），每次內(nèi)存IO獲取數(shù)據(jù)都是從同行同列的8個(gè)chip中各自讀取一個(gè)字節(jié)拼起來的。從內(nèi)存的0地址開始，0-63bit的數(shù)據(jù)可以一次IO讀取出來，64-127bit的數(shù)據(jù)也可以一次讀取出來。CPU和內(nèi)存IO的硬件限制導(dǎo)致沒辦法一次跨在兩個(gè)數(shù)據(jù)寬度中間進(jìn)行IO。
- 假如對于一個(gè)c的程序員，如果把一個(gè)bigint（64位）地址寫到的0x0001開始，而不是0x0000開始，那么數(shù)據(jù)并沒有存在同一行列地址上。因此cpu必須得讓內(nèi)存工作兩次才能取到完整的數(shù)據(jù)。效率自然就很低。
- 如果不強(qiáng)制對地址進(jìn)行操作，僅僅只是簡單用c定義一個(gè)結(jié)構(gòu)體，編譯和鏈接器會自動替開發(fā)者對齊內(nèi)存的。盡量幫你保證一個(gè)變量不跨列尋址。
- 在內(nèi)存硬件層上，還有操作系統(tǒng)層。操作系統(tǒng)還管理了CPU的一級、二級、三級緩存。實(shí)際中不一定每次IO都從內(nèi)存出，如果你的數(shù)據(jù)局部性足夠好，那么很有可能只需要少量的內(nèi)存IO，大部分都是更為高效的高速緩存IO。但是高速緩存和內(nèi)存一樣，也是要考慮對齊的。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

OC底層原理(二).內(nèi)存分配與內(nèi)存對齊

OC底層原理(二).內(nèi)存分配與內(nèi)存對齊

從內(nèi)存分配開始

分析`instanceSize`函數(shù)的實(shí)現(xiàn)

獲取內(nèi)存大小的三種方式

為什么是48字節(jié)？

為什么系統(tǒng)分配內(nèi)存要以16字節(jié)對齊

內(nèi)存對齊

內(nèi)存對齊規(guī)則

內(nèi)存對齊實(shí)踐

struct TestStruct1

struct TestStruct2

struct TestStruct3

為什么要內(nèi)存對齊

1.平臺

2.CPU原因

3.內(nèi)存原因

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

OC底層原理(二).內(nèi)存分配與內(nèi)存對齊

從內(nèi)存分配開始

分析instanceSize函數(shù)的實(shí)現(xiàn)

獲取內(nèi)存大小的三種方式

為什么是48字節(jié)？

為什么系統(tǒng)分配內(nèi)存要以16字節(jié)對齊

內(nèi)存對齊

內(nèi)存對齊規(guī)則

內(nèi)存對齊實(shí)踐

struct TestStruct1

struct TestStruct2

struct TestStruct3

為什么要內(nèi)存對齊

1.平臺

2.CPU原因

3.內(nèi)存原因

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

分析`instanceSize`函數(shù)的實(shí)現(xiàn)

為什么是48字節(jié)？