OC消息轉(zhuǎn)發(fā)(一)— objc_msgSend探索

前言

該系列我們來探究一下OC的消息發(fā)送和轉(zhuǎn)發(fā)機制,本文我們就來對objc_msgSend做一下初步探索,明白方法調(diào)用是如何快速尋找到方法的。以后我們會探索到慢速尋找方法以及找不到方法是如何進行消息轉(zhuǎn)發(fā)的。

runtime簡介

要探索objc_msgSend,我們首先要了解runtime。runtimeC、C++、匯編混合寫成的一套為Objective-C提供運行時功能的API。也是因為runtime,Object-C才被成為動態(tài)語言。

runtime的版本

runtime的版本分為兩個版本modernlegacy官方文檔),我們現(xiàn)在使用的Objective-C 2.0版本就是modern版本,只能適用于iOS64 bit OS X 10.5版本及更高版本;legacy則適用于其他版本和32 bit OS X。modernlegacy最大的區(qū)別就是如果更改類中實例變量的布局,legacy需要重新編譯他的子類,modern版本則不需要。

runtime的使用

runtime的使用大致可分為三種使用方法。

  • Objective-Ccode:@selector()等;
  • NSObject的方法:NSSelectorFromString()等;
  • runtimeapisel_registerName()等;
編譯時和運行時

編譯時:即編譯器對語言的編譯階段,編譯時只是對語言進行最基本的檢查報錯,包括詞法分析、語法分析等等,將程序代碼翻譯成計算機能夠識別的語言(例如匯編等),編譯通過并不意味著程序就可以成功運行。
運行時:即程序通過了編譯這一關(guān)之后編譯好的代碼被裝載到內(nèi)存中跑起來的階段,這個時候會具體對類型進行檢查,而不僅僅是對代碼的簡單掃描分析,此時若出錯程序會崩潰。這個階段也是runtime起作用的階段。

objc_msgSend探索

一、clang生成cpp文件
創(chuàng)建工程,在main.m寫入以下代碼:

void run(){
    NSLog(@"%s",__func__);
}
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        //創(chuàng)建LGPerson類和對象方法sayNB
        LGPerson *person = [LGPerson alloc];
        [person sayNB];
        run();
    }
    return 0;
}

打開終端進入main.m文件目錄下,執(zhí)行以下命令:

clang -rewrite-objc main.m -o main.cpp

在此文件夾下會生成一個main.cpp文件,打開文件滑動到底部可以看到如下代碼:

void run(){
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_85_h8yymn657hq3vfgnz_xwbtjc0000gp_T_main_26fe1b_mi_0,__func__);
}
int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
        LGPerson *person = ((LGPerson *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("LGPerson"), sel_registerName("alloc"));
        ((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayNB"));

        run();
    }
    return 0;
}

從代碼中可以看出,調(diào)用allocsayNB兩個方法被轉(zhuǎn)換成了objc_msgSend發(fā)送消息((void (*)(id, SEL))(void *)是類型強轉(zhuǎn)),而我寫的一個run()函數(shù)則是直接調(diào)用,不是通過objc_msgSend進行消息發(fā)送,由此可以看出只有Objective-C的方法是通過runtime轉(zhuǎn)換為消息發(fā)送的。

objc_msgSend(id _Nullable self, SEL _Nonnull op, ...)

objc_msgSend的兩個參數(shù)idsel代表消息接收者和方法唯一標(biāo)識。
二、斷點看匯編
sayNB處打斷點,如圖:

斷點sayNB

進入斷點,然后菜單 Debug -> Debug Workflow -> Always Show Disassembly,顯示匯編如下:

objc_msgSend匯編

可以看到objc_msgSend,然后按著control+進入objc_msgSend詳情,如下:

objc_msgSend詳情

可已看出objc_msgSend是在libobjc里邊,接下來我們?nèi)フ以创a看看objc_msgSend是如何快速進行方法查找的。
三、objc_msgSend匯編源碼
objc_msgSend源碼是用匯編寫的,全局搜索objc_msgSend找到匯編(文件表示上為sarm64文件,ENTRY _objc_msgSend是開始如下:

尋找objc_msgSend

objc_msgSend匯編源碼如下:

    ENTRY _objc_msgSend
    UNWIND _objc_msgSend, NoFrame

    cmp p0, #0          // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
    ldr p13, [x0]       // p13 = isa
    GetClassFromIsa_p16 p13     // p16 = class
LGetIsaDone:
    CacheLookup NORMAL      // calls imp or objc_msgSend_uncached

可以看出先進行了niltagged pointer的檢測,SUPPORT_TAGGED_POINTERSarm64下為1,ldr p13, [x0]把在[x0]位置的isa存入p13中,GetClassFromIsa_p16 p13通過isa獲取class,GetClassFromIsa_p16詳情如下:

.macro GetClassFromIsa_p16 /* src */

#if SUPPORT_INDEXED_ISA
    // Indexed isa
    mov p16, $0         // optimistically set dst = src
    tbz p16, #ISA_INDEX_IS_NPI_BIT, 1f  // done if not non-pointer isa
    // isa in p16 is indexed
    adrp    x10, _objc_indexed_classes@PAGE
    add x10, x10, _objc_indexed_classes@PAGEOFF
    ubfx    p16, p16, #ISA_INDEX_SHIFT, #ISA_INDEX_BITS  // extract index
    ldr p16, [x10, p16, UXTP #PTRSHIFT] // load class from array
1:

#elif __LP64__
    // 64-bit packed isa
    and p16, $0, #ISA_MASK

#else
    // 32-bit raw isa
    mov p16, $0

#endif

.endmacro

isa指針詳解文章中SUPPORT_INDEXED_ISA在iOS設(shè)備上是0,那么進入and p16, $0, #ISA_MASK中,也即是通過掩碼ISA_MASKisa獲取類信息。
接下來全局搜索CacheLookup,找到帶有.macro的宏定義,是CacheLookup詳情。如下:

.macro CacheLookup
    // p1 = SEL, p16 = class
    ldp p10, p11, [x16, #CACHE] // p10 = buckets, p11 = occupied|mask
#if !__LP64__
    and w11, w11, 0xffff    // p11 = mask
#endif
    and w12, w1, w11        // x12 = _cmd & mask
    add p12, p10, p12, LSL #(1+PTRSHIFT)
                     // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // wrap: p12 = first bucket, w11 = mask
    add p12, p12, w11, UXTW #(1+PTRSHIFT)
                                // p12 = buckets + (mask << 1+PTRSHIFT)

    // Clone scanning loop to miss instead of hang when cache is corrupt.
    // The slow path may detect any corruption and halt later.

    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // double wrap
    JumpMiss $0
    
.endmacro

參考類的結(jié)構(gòu)分析,分析上方匯編代碼:

注意:p、wx的區(qū)別
p16代表指針;w16代表32位下的值,4字節(jié);x16代表64位下的值,8字節(jié);

  • ldp p10, p11, [x16, #CACHE]:全局搜索define #CACHE會發(fā)現(xiàn)#CACHE是16,通過GetClassFromIsa_p16可以知道x16代表class,對象結(jié)構(gòu)里內(nèi)存平移16位(isasuperclass)可以得到cache,cache又包含了_buckets_mask_occupied。這句匯編的意思就是把_buckets存入到p10,把_mask_occupied存入到p11,又因為是小端模式,p11 = occupied|mask

  • and w12, w1, w11:這里用w是因為代表8字節(jié)只取4字節(jié),即w11=maskw1sel轉(zhuǎn)換之后的key,w12存儲的是key&mask即方法在哈希表的索引值。

  • add p12, p10, p12, LSL #(1+PTRSHIFT)p10buckets的首地址,而bucket_t結(jié)構(gòu)體占用16字節(jié),所以buckets的首地址加上索引向左偏移(1+PTRSHIFT)字節(jié)得到的值就是函數(shù)方法在緩存中的地址。因此p12就是函數(shù)方法對應(yīng)的bucket地址。

  • ldp p17, p9, [x12]:將bucket存放在p17p9中,p17impp9里裝sel。

  • 1: cmp p9, p1:比較取出來的selp1是否相等,b.ne 2f不相等進入2:CheckMiss $0緩存未命中;相等則是CacheHit $0緩存命中。CacheHit詳情如下:

// CacheHit: x17 = cached IMP, x12 = address of cached IMP
.macro CacheHit
.if $0 == NORMAL
    TailCallCachedImp x17, x12  // authenticate and call imp
.elseif $0 == GETIMP
    mov p0, p17
    AuthAndResignAsIMP x0, x12  // authenticate imp and re-sign as IMP
    ret             // return IMP
.elseif $0 == LOOKUP
    AuthAndResignAsIMP x17, x12 // authenticate imp and re-sign as IMP
    ret             // return imp via x17
.else
.abort oops
.endif
.endmacro

CacheHit就是找到了imp,那么直接調(diào)用TailCallCachedImp就完成了查找。

  • cmp p12, p10:比較p12p10是否相等,相等的話說明進入3f:add p12, p12, w11, UXTW #(1+PTRSHIFT),索引值即為mask;不相等則重新賦值p9,循環(huán)進入1f。下方de就是進入到循環(huán)查找imp的循環(huán)中了。
  • JumpMiss $0:跳轉(zhuǎn)到JumpMiss。如下:
.macro JumpMiss
.if $0 == GETIMP
    b   LGetImpMiss
.elseif $0 == NORMAL
    b   __objc_msgSend_uncached
.elseif $0 == LOOKUP
    b   __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro

進入NORMAL判斷中,調(diào)用__objc_msgSend_uncached。如下:

STATIC_ENTRY __objc_msgSend_uncached
UNWIND __objc_msgSend_uncached, FrameWithNoSaves

    // THIS IS NOT A CALLABLE C FUNCTION
    // Out-of-band p16 is the class to search
    
    MethodTableLookup
    TailCallFunctionPointer x17

    END_ENTRY __objc_msgSend_uncached

然后調(diào)用MethodTableLookup,如下:

.macro MethodTableLookup
    
    // push frame
    SignLR
    stp fp, lr, [sp, #-16]!
    mov fp, sp

    // save parameter registers: x0..x8, q0..q7
    sub sp, sp, #(10*8 + 8*16)
    stp q0, q1, [sp, #(0*16)]
    stp q2, q3, [sp, #(2*16)]
    stp q4, q5, [sp, #(4*16)]
    stp q6, q7, [sp, #(6*16)]
    stp x0, x1, [sp, #(8*16+0*8)]
    stp x2, x3, [sp, #(8*16+2*8)]
    stp x4, x5, [sp, #(8*16+4*8)]
    stp x6, x7, [sp, #(8*16+6*8)]
    str x8,     [sp, #(8*16+8*8)]

    // receiver and selector already in x0 and x1
    mov x2, x16
    bl  __class_lookupMethodAndLoadCache3

    // IMP in x0
    mov x17, x0
    
    // restore registers and return
    ldp q0, q1, [sp, #(0*16)]
    ldp q2, q3, [sp, #(2*16)]
    ldp q4, q5, [sp, #(4*16)]
    ldp q6, q7, [sp, #(6*16)]
    ldp x0, x1, [sp, #(8*16+0*8)]
    ldp x2, x3, [sp, #(8*16+2*8)]
    ldp x4, x5, [sp, #(8*16+4*8)]
    ldp x6, x7, [sp, #(8*16+6*8)]
    ldr x8,     [sp, #(8*16+8*8)]

    mov sp, fp
    ldp fp, lr, [sp], #16
    AuthenticateLR

.endmacro

最后是調(diào)用了__class_lookupMethodAndLoadCache3方法,bl是跳轉(zhuǎn)方法,該方法還帶有雙下劃線,并且搜不到方法的具體實現(xiàn),可以得出該方法不再是匯編方法,應(yīng)該是跳轉(zhuǎn)到了C或者C++的方法。
到此我們就把objc_msgSend匯編快速查找方法的探索完了,那為什么要用匯編語言查找方法呢?大概是有兩個原因:
1、這個過程需要的是速度,匯編更容易被計算機識別,速度更快。
2、因為方法都會有傳參和返回參數(shù),而且是不確定的,相對于C或者C++是很難實現(xiàn)這些的,但是匯編是可以的。

總結(jié)

1、Objective-C調(diào)用方法是一個通過objc_msgSend發(fā)送消息進行查找方法的實現(xiàn)imp的。
2、objc_msgSend查找方法首先是匯編語言查找,這是一個快速的過程。還有一個是慢速查找的過程。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容