iOS開發(fā)--APP性能檢測方案匯總(一)

APP的性能監(jiān)控包括: CPU 占用率、 內(nèi)存使用情況、網(wǎng)絡(luò)狀況監(jiān)控、啟動時閃退卡頓、FPS使用時崩潰、耗電量監(jiān)控、流量監(jiān)控等等。

文中所有代碼都已同步到github中,有興趣的可以clone下來一起探討下。

1 . CPU 占用率

CPU作為手機的中央處理器,可以說是手機最關(guān)鍵的組成部分,所有應(yīng)用程序都需要它來調(diào)度運行,資源有限。所以當(dāng)我們的APP因設(shè)計不當(dāng),使 CPU 持續(xù)以高負載運行,將會出現(xiàn)APP卡頓、手機發(fā)熱發(fā)燙、電量消耗過快等等嚴重影響用戶體驗的現(xiàn)象。

因此我們對應(yīng)用在CPU中占用率的監(jiān)控,將變得尤為重要。那么我們應(yīng)該如何來獲取CPU的占有率呢?!

我們都知道,我們的APP在運行的時候,會對應(yīng)一個Mach Task,而Task下可能有多條線程同時執(zhí)行任務(wù),每個線程都是作為利用CPU的基本單位。所以我們可以通過獲取當(dāng)前Mach Task下,所有線程占用 CPU 的情況,來計算APP的 CPU 占用率。

在《OS X and iOS Kernel Programming》是這樣描述 Mach task 的:

任務(wù)(task)是一種容器(container)對象,虛擬內(nèi)存空間和其他資源都是通過這個容器對象管理的,這些資源包括設(shè)備和其他句柄。嚴格地說,Mach 的任務(wù)并不是其他操作系統(tǒng)中所謂的進程,因為 Mach 作為一個微內(nèi)核的操作系統(tǒng),并沒有提供“進程”的邏輯,而只是提供了最基本的實現(xiàn)。不過在 BSD 的模型中,這兩個概念有1:1的簡單映射,每一個 BSD 進程(也就是 OS X 進程)都在底層關(guān)聯(lián)了一個 Mach 任務(wù)對象。

Mac OS X 中進程子系統(tǒng)組成的概念圖

iOS 是基于 Apple Darwin 內(nèi)核,由kernel、XNURuntime 組成,而XNUDarwin 的內(nèi)核,它是“X is not UNIX”的縮寫,是一個混合內(nèi)核,由 Mach 微內(nèi)核和 BSD 組成。Mach 內(nèi)核是輕量級的平臺,只能完成操作系統(tǒng)最基本的職責(zé),比如:進程和線程、虛擬內(nèi)存管理、任務(wù)調(diào)度、進程通信和消息傳遞機制等。其他的工作,例如文件操作和設(shè)備訪問,都由 BSD 層實現(xiàn)。

iOS 的線程技術(shù)與Mac OS X類似,也是基于 Mach 線程技術(shù)實現(xiàn)的,在 Mach 層中thread_basic_info 結(jié)構(gòu)體封裝了單個線程的基本信息:

struct thread_basic_info {
    time_value_t  user_time;      /* user run time */
    time_value_t  system_time;    /* system run time */
    integer_t    cpu_usage;       /* scaled cpu usage percentage */
    policy_t     policy;          /* scheduling policy in effect */
    integer_t    run_state;       /* run state (see below) */
    integer_t    flags;           /* various flags (see below) */
    integer_t    suspend_count;   /* suspend count for thread */
    integer_t    sleep_time;      /* number of seconds that thread  has been sleeping */
}

一個Mach Task包含它的線程列表。內(nèi)核提供了task_threads API 調(diào)用獲取指定 task 的線程列表,然后可以通過thread_info API調(diào)用來查詢指定線程的信息,在 thread_act.h 中有相關(guān)定義。

task_threadstarget_task 任務(wù)中的所有線程保存在act_list數(shù)組中,act_listCnt表示線程個數(shù):

kern_return_t task_threads
(
    task_t target_task,
    thread_act_array_t *act_list,
    mach_msg_type_number_t *act_listCnt
);

thread_info結(jié)構(gòu)如下:

kern_return_t thread_info
(
    thread_act_t target_act,
    thread_flavor_t flavor,  // 傳入不同的宏定義獲取不同的線程信息
    thread_info_t thread_info_out,  // 查詢到的線程信息
    mach_msg_type_number_t *thread_info_outCnt  // 信息的大小
);

所以我們?nèi)缦聛慝@取CPU的占有率:

#import "LSLCpuUsage.h"
#import <mach/task.h>
#import <mach/vm_map.h>
#import <mach/mach_init.h>
#import <mach/thread_act.h>
#import <mach/thread_info.h>

@implementation LSLCpuUsage

+ (double)getCpuUsage {
    kern_return_t           kr;
    thread_array_t          threadList;         // 保存當(dāng)前Mach task的線程列表
    mach_msg_type_number_t  threadCount;        // 保存當(dāng)前Mach task的線程個數(shù)
    thread_info_data_t      threadInfo;         // 保存單個線程的信息列表
    mach_msg_type_number_t  threadInfoCount;    // 保存當(dāng)前線程的信息列表大小
    thread_basic_info_t     threadBasicInfo;    // 線程的基本信息
    
    // 通過“task_threads”API調(diào)用獲取指定 task 的線程列表
    //  mach_task_self_,表示獲取當(dāng)前的 Mach task
    kr = task_threads(mach_task_self(), &threadList, &threadCount);
    if (kr != KERN_SUCCESS) {
        return -1;
    }
    double cpuUsage = 0;
    for (int i = 0; i < threadCount; i++) {
        threadInfoCount = THREAD_INFO_MAX;
        // 通過“thread_info”API調(diào)用來查詢指定線程的信息
        //  flavor參數(shù)傳的是THREAD_BASIC_INFO,使用這個類型會返回線程的基本信息,
        //  定義在 thread_basic_info_t 結(jié)構(gòu)體,包含了用戶和系統(tǒng)的運行時間、運行狀態(tài)和調(diào)度優(yōu)先級等
        kr = thread_info(threadList[i], THREAD_BASIC_INFO, (thread_info_t)threadInfo, &threadInfoCount);
        if (kr != KERN_SUCCESS) {
            return -1;
        }
        
        threadBasicInfo = (thread_basic_info_t)threadInfo;
        if (!(threadBasicInfo->flags & TH_FLAGS_IDLE)) {
            cpuUsage += threadBasicInfo->cpu_usage;
        }
    }
    
    // 回收內(nèi)存,防止內(nèi)存泄漏
    vm_deallocate(mach_task_self(), (vm_offset_t)threadList, threadCount * sizeof(thread_t));

    return cpuUsage / (double)TH_USAGE_SCALE * 100.0;
}
@end

2. 內(nèi)存

雖然現(xiàn)在的手機內(nèi)存越來越大,但畢竟是有限的,如果因為我們的應(yīng)用設(shè)計不當(dāng)造成內(nèi)存過高,可能面臨被系統(tǒng)“干掉”的風(fēng)險,這對用戶來說是毀滅性的體驗。

Mach task 的內(nèi)存使用信息存放在mach_task_basic_info結(jié)構(gòu)體中 ,其中resident_size 為應(yīng)用使用的物理內(nèi)存大小,virtual_size為虛擬內(nèi)存大小,在task_info.h中:

#define MACH_TASK_BASIC_INFO     20         /* always 64-bit basic info */
struct mach_task_basic_info {
        mach_vm_size_t  virtual_size;       /* virtual memory size (bytes) */
        mach_vm_size_t  resident_size;      /* resident memory size (bytes) */
        mach_vm_size_t  resident_size_max;  /* maximum resident memory size (bytes) */
        time_value_t    user_time;          /* total user run time for
                                               terminated threads */
        time_value_t    system_time;        /* total system run time for
                                               terminated threads */
        policy_t        policy;             /* default policy for new threads */
        integer_t       suspend_count;      /* suspend count for task */
};

獲取方式是通過task_infoAPI 根據(jù)指定的 flavor 類型,返回 target_task 的信息,在task.h中:

kern_return_t task_info
(
    task_name_t target_task,
    task_flavor_t flavor,
    task_info_t task_info_out,
    mach_msg_type_number_t *task_info_outCnt
);

筆者嘗試過使用如下方式獲取內(nèi)存情況,基本和騰訊的GT的相近,但是和Xcode和Instruments的值有較大差距:

// 獲取當(dāng)前應(yīng)用的內(nèi)存占用情況,和Xcode數(shù)值相差較大
+ (double)getResidentMemory {
    struct mach_task_basic_info info;
    mach_msg_type_number_t count = MACH_TASK_BASIC_INFO_COUNT;
    if (task_info(mach_task_self(), MACH_TASK_BASIC_INFO, (task_info_t)&info, &count) == KERN_SUCCESS) {
        return info.resident_size / (1024 * 1024);
    } else {
        return -1.0;
    }
}

后來看了一篇博主討論了這個問題,說使用phys_footprint才是正解,博客地址。親測,基本和Xcode的數(shù)值相近。

// 獲取當(dāng)前應(yīng)用的內(nèi)存占用情況,和Xcode數(shù)值相近
+ (double)getMemoryUsage {
    task_vm_info_data_t vmInfo;
    mach_msg_type_number_t count = TASK_VM_INFO_COUNT;
    if(task_info(mach_task_self(), TASK_VM_INFO, (task_info_t) &vmInfo, &count) == KERN_SUCCESS) {
        return (double)vmInfo.phys_footprint / (1024 * 1024);
    } else {
        return -1.0;
    }
}

博主文中提到:關(guān)于 phys_footprint 的定義可以在 XNU 源碼中,找到 osfmk/kern/task.c 里對于 phys_footprint 的注釋,博主認為注釋里提到的公式計算的應(yīng)該才是應(yīng)用實際使用的物理內(nèi)存。

/*
 * phys_footprint
 *   Physical footprint: This is the sum of:
 *     + (internal - alternate_accounting)
 *     + (internal_compressed - alternate_accounting_compressed)
 *     + iokit_mapped
 *     + purgeable_nonvolatile
 *     + purgeable_nonvolatile_compressed
 *     + page_table
 *
 * internal
 *   The task's anonymous memory, which on iOS is always resident.
 *
 * internal_compressed
 *   Amount of this task's internal memory which is held by the compressor.
 *   Such memory is no longer actually resident for the task [i.e., resident in its pmap],
 *   and could be either decompressed back into memory, or paged out to storage, depending
 *   on our implementation.
 *
 * iokit_mapped
 *   IOKit mappings: The total size of all IOKit mappings in this task, regardless of
     clean/dirty or internal/external state].
 *
 * alternate_accounting
 *   The number of internal dirty pages which are part of IOKit mappings. By definition, these pages
 *   are counted in both internal *and* iokit_mapped, so we must subtract them from the total to avoid
 *   double counting.
 */

當(dāng)然我也是贊同這點的>.<。


3. 啟動時間

APP的啟動時間,直接影響用戶對你的APP的第一體驗和判斷。如果啟動時間過長,不單單體驗直線下降,而且可能會激發(fā)蘋果的watch dog機制kill掉你的APP,那就悲劇了,用戶會覺得APP怎么一啟動就卡死然后崩潰了,不能用,然后長按APP點擊刪除鍵。(Xcode在debug模式下是沒有開啟watch dog的,所以我們一定要連接真機測試我們的APP)

在衡量APP的啟動時間之前我們先了解下,APP的啟動流程:

APP啟動過程

APP的啟動可以分為兩個階段,即main()執(zhí)行之前和main()執(zhí)行之后??偨Y(jié)如下:

t(App 總啟動時間) = t1( main()之前的加載時間 ) + t2( main()之后的加載時間 )。

  • t1 = 系統(tǒng)的 dylib (動態(tài)鏈接庫)和 App 可執(zhí)行文件的加載時間;
  • t2 = main()函數(shù)執(zhí)行之后到AppDelegate類中的applicationDidFinishLaunching:withOptions:方法執(zhí)行結(jié)束前這段時間。

所以我們對APP啟動時間的獲取和優(yōu)化都是從這兩個階段著手,下面先看看main()函數(shù)執(zhí)行之前如何獲取啟動時間。

衡量main()函數(shù)執(zhí)行之前的耗時

對于衡量main()之前也就是time1的耗時,蘋果官方提供了一種方法,即在真機調(diào)試的時候,勾選DYLD_PRINT_STATISTICS選項(如果想獲取更詳細的信息可以使用DYLD_PRINT_STATISTICS_DETAILS),如下圖:

main()函數(shù)之前

輸出結(jié)果如下:

Total pre-main time:  34.22 milliseconds (100.0%)
         dylib loading time:  14.43 milliseconds (42.1%)
        rebase/binding time:   1.82 milliseconds (5.3%)
            ObjC setup time:   3.89 milliseconds (11.3%)
           initializer time:  13.99 milliseconds (40.9%)
           slowest intializers :
             libSystem.B.dylib :   2.20 milliseconds (6.4%)
   libBacktraceRecording.dylib :   2.90 milliseconds (8.4%)
    libMainThreadChecker.dylib :   6.55 milliseconds (19.1%)
       libswiftCoreImage.dylib :   0.71 milliseconds (2.0%)

系統(tǒng)級別的動態(tài)鏈接庫,因為蘋果做了優(yōu)化,所以耗時并不多,而大多數(shù)時候,t1的時間大部分會消耗在我們自身App中的代碼上和鏈接第三方庫上。

所以我們應(yīng)如何減少main()調(diào)用之前的耗時呢,我們可以優(yōu)化的點有:

  1. 減少不必要的framework,特別是第三方的,因為動態(tài)鏈接比較耗時;
  2. check framework應(yīng)設(shè)為optionalrequired,如果該framework在當(dāng)前App支持的所有iOS系統(tǒng)版本都存在,那么就設(shè)為required,否則就設(shè)為optional,因為optional會有些額外的檢查;
  3. 合并或者刪減一些OC類,關(guān)于清理項目中沒用到的類,可以借助AppCode代碼檢查工具:
  • 刪減一些無用的靜態(tài)變量
  • 刪減沒有被調(diào)用到或者已經(jīng)廢棄的方法
  • 將不必須在+load方法中做的事情延遲到+initialize
  • 盡量不要用C++虛函數(shù)(創(chuàng)建虛函數(shù)表有開銷)

衡量main()函數(shù)執(zhí)行之后的耗時

第二階段的耗時統(tǒng)計,我們認為是從main ()執(zhí)行之后到applicationDidFinishLaunching:withOptions:方法最后,那么我們可以通過打點的方式進行統(tǒng)計。
Objective-C項目因為有main文件,所以我么直接可以通過添加代碼獲?。?/p>

// 1. 在 main.m 添加如下代碼:
CFAbsoluteTime AppStartLaunchTime;

int main(int argc, char * argv[]) {
    AppStartLaunchTime = CFAbsoluteTimeGetCurrent();
  .....
}

// 2. 在 AppDelegate.m 的開頭聲明
extern CFAbsoluteTime AppStartLaunchTime;

// 3. 最后在AppDelegate.m 的 didFinishLaunchingWithOptions 中添加
dispatch_async(dispatch_get_main_queue(), ^{
  NSLog(@"App啟動時間--%f",(CFAbsoluteTimeGetCurrent()-AppStartLaunchTime));
});

大家都知道Swift項目是沒有main文件,官方給了如下解釋:

In Xcode, Mac templates default to including a “main.swift” file, but for iOS apps the default for new iOS project templates is to add @UIApplicationMain to a regular Swift file. This causes the compiler to synthesize a mainentry point for your iOS app, and eliminates the need for a “main.swift” file.

也就是說,通過添加@UIApplicationMain標(biāo)志的方式,幫我們添加了mian函數(shù)了。所以如果是我們需要在mian函數(shù)中做一些其它操作的話,需要我們自己來創(chuàng)建main.swift文件,這個也是蘋果允許的。

    1. 刪除AppDelegate類中的 @UIApplicationMain標(biāo)志;
    1. 自行創(chuàng)建main.swift文件,并添加程序入口:
import UIKit

var appStartLaunchTime: CFAbsoluteTime = CFAbsoluteTimeGetCurrent()

UIApplicationMain(
    CommandLine.argc,
    UnsafeMutableRawPointer(CommandLine.unsafeArgv)
        .bindMemory(
            to: UnsafeMutablePointer<Int8>.self,
            capacity: Int(CommandLine.argc)),
    nil,
    NSStringFromClass(AppDelegate.self)
)
    1. 在AppDelegate的didFinishLaunchingWithOptions :方法最后添加:
// APP啟動時間耗時,從mian函數(shù)開始到didFinishLaunchingWithOptions方法結(jié)束
DispatchQueue.main.async {
  print("APP啟動時間耗時,從mian函數(shù)開始到didFinishLaunchingWithOptions方法:\(CFAbsoluteTimeGetCurrent() - appStartLaunchTime)。")
}

main函數(shù)之后的優(yōu)化:

    1. 盡量使用純代碼編寫,減少xib的使用;
    1. 啟動階段的網(wǎng)絡(luò)請求,是否都放到異步請求;
    1. 一些耗時的操作是否可以放到后面去執(zhí)行,或異步執(zhí)行等。

4. FPS

通過維基百科我們知道,FPSFrames Per Second 的簡稱縮寫,意思是每秒傳輸幀數(shù),也就是我們常說的“刷新率(單位為Hz)。

FPS是測量用于保存、顯示動態(tài)視頻的信息數(shù)量。每秒鐘幀數(shù)愈多,所顯示的畫面就會愈流暢,FPS值越低就越卡頓,所以這個值在一定程度上可以衡量應(yīng)用在圖像繪制渲染處理時的性能。一般我們的APP的FPS只要保持在 50-60之間,用戶體驗都是比較流暢的。

蘋果手機屏幕的正常刷新頻率是每秒60次,即可以理解為FPS值為60。我們都知道CADisplayLink是和屏幕刷新頻率保存一致,所以我們是否可以通過它來監(jiān)控我們的FPS呢?!

首先CADisplayLink是什么

CADisplayLinkCoreAnimation提供的另一個類似于NSTimer的類,它總是在屏幕完成一次更新之前啟動,它的接口設(shè)計的和NSTimer很類似,所以它實際上就是一個內(nèi)置實現(xiàn)的替代,但是和timeInterval以秒為單位不同,CADisplayLink有一個整型的frameInterval屬性,指定了間隔多少幀之后才執(zhí)行。默認值是1,意味著每次屏幕更新之前都會執(zhí)行一次。但是如果動畫的代碼執(zhí)行起來超過了六十分之一秒,你可以指定frameInterval為2,就是說動畫每隔一幀執(zhí)行一次(一秒鐘30幀)。

使用CADisplayLink監(jiān)控界面的FPS值,參考自YYFPSLabel

import UIKit

class LSLFPSMonitor: UILabel {

    private var link: CADisplayLink = CADisplayLink.init()
    private var count: NSInteger = 0
    private var lastTime: TimeInterval = 0.0
    private var fpsColor: UIColor = UIColor.green
    public var fps: Double = 0.0
    
    // MARK: - init
    
    override init(frame: CGRect) {
        var f = frame
        if f.size == CGSize.zero {
            f.size = CGSize(width: 55.0, height: 22.0)
        }
        super.init(frame: f)
        
        self.textColor = UIColor.white
        self.textAlignment = .center
        self.font = UIFont.init(name: "Menlo", size: 12.0)
        self.backgroundColor = UIColor.black
        
        link = CADisplayLink.init(target: LSLWeakProxy(target: self), selector: #selector(tick))
        link.add(to: RunLoop.current, forMode: RunLoopMode.commonModes)
    }
    
    deinit {
        link.invalidate()
    }
    
    required init?(coder aDecoder: NSCoder) {
        fatalError("init(coder:) has not been implemented")
    }
    
    // MARK: - actions
    
    @objc func tick(link: CADisplayLink) {
        guard lastTime != 0 else {
            lastTime = link.timestamp
            return
        }
        
        count += 1
        let delta = link.timestamp - lastTime
        guard delta >= 1.0 else {
            return
        }
        
        lastTime = link.timestamp
        fps = Double(count) / delta
        let fpsText = "\(String.init(format: "%.3f", fps)) FPS"
        count = 0
        
        let attrMStr = NSMutableAttributedString(attributedString: NSAttributedString(string: fpsText))
        if fps > 55.0{
            fpsColor = UIColor.green
        } else if(fps >= 50.0 && fps <= 55.0) {
            fpsColor = UIColor.yellow
        } else {
            fpsColor = UIColor.red
        }
        attrMStr.setAttributes([NSAttributedStringKey.foregroundColor:fpsColor], range: NSMakeRange(0, attrMStr.length - 3))
        attrMStr.setAttributes([NSAttributedStringKey.foregroundColor:UIColor.white], range: NSMakeRange(attrMStr.length - 3, 3))
        DispatchQueue.main.async {
            self.attributedText = attrMStr
        }
    }
}

通過CADisplayLink的實現(xiàn)方式,并真機測試之后,確實是可以在很大程度上滿足了監(jiān)控FPS的業(yè)務(wù)需求和為提高用戶體驗提供參考,但是和Instruments的值可能會有些出入。下面我們來討論下使用CADisplayLink的方式,可能存在的問題。

  • (1). 和Instruments值對比有出入,原因如下:

CADisplayLink運行在被添加的那個RunLoop之中(一般是在主線程中),因此它只能檢測出當(dāng)前RunLoop下的幀率。RunLoop中所管理的任務(wù)的調(diào)度時機,受任務(wù)所處的RunLoopMode和CPU的繁忙程度所影響。所以想要真正定位到準確的性能問題所在,最好還是通過Instrument來確認。

  • (2). 使用CADisplayLink可能存在的循環(huán)引用問題。

例如以下寫法:

let link = CADisplayLink.init(target: self, selector: #selector(tick))

let timer = Timer.init(timeInterval: 1.0, target: self, selector: #selector(tick), userInfo: nil, repeats: true)

原因:以上兩種用法,都會對 self 強引用,此時 timer持有 self,self 也持有 timer,循環(huán)引用導(dǎo)致頁面 dismiss 時,雙方都無法釋放,造成循環(huán)引用。此時使用 weak 也不能有效解決:

weak var weakSelf = self
let link = CADisplayLink.init(target: weakSelf, selector: #selector(tick))

那么我們應(yīng)該怎樣解決這個問題,有人會說在deinit(或dealloc)中調(diào)用定時器的invalidate方法,但是這是無效的,因為已經(jīng)造成循環(huán)引用了,不會走到這個方法的。

YYKit作者提供的解決方案是使用 YYWeakProxy,這個YYWeakProxy不是繼承自NSObject而是繼承NSProxy。

NSProxy

An abstract superclass defining an API for objects that act as stand-ins for other objects or for objects that don’t exist yet.

NSProxy是一個為對象定義接口的抽象父類,并且為其它對象或者一些不存在的對象扮演了替身角色。具體的可以看下NSProxy的官方文檔
修改后代碼如下,親測定時器如愿釋放,LSLWeakProxy的具體實現(xiàn)代碼已經(jīng)同步到github中。

let link = CADisplayLink.init(target: LSLWeakProxy(target: self), selector: #selector(tick))

5. 卡頓

在了解卡頓產(chǎn)生的原因之前,先看下屏幕顯示圖像的原理。

屏幕顯示圖像的原理:

屏幕繪制原理

現(xiàn)在的手機設(shè)備基本都是采用雙緩存+垂直同步(即V-Sync)屏幕顯示技術(shù)。

如上圖所示,系統(tǒng)內(nèi)CPU、GPU和顯示器是協(xié)同完成顯示工作的。其中CPU負責(zé)計算顯示的內(nèi)容,例如視圖創(chuàng)建、布局計算、圖片解碼、文本繪制等等。隨后CPU將計算好的內(nèi)容提交給GPU,由GPU進行變換、合成、渲染。GPU會預(yù)先渲染好一幀放入一個緩沖區(qū)內(nèi),讓視頻控制器讀取,當(dāng)下一幀渲染好后,GPU會直接將視頻控制器的指針指向第二個容器(雙緩存原理)。這里,GPU會等待顯示器的VSync(即垂直同步)信號發(fā)出后,才進行新的一幀渲染和緩沖區(qū)更新(這樣能解決畫面撕裂現(xiàn)象,也增加了畫面流暢度,但需要消費更多的計算資源,也會帶來部分延遲)。

卡頓的原因:

掉幀

由上面屏幕顯示的原理,采用了垂直同步機制的手機設(shè)備。如果在一個VSync 時間內(nèi),CPUGPU 沒有完成內(nèi)容提交,則那一幀就會被丟棄,等待下一次機會再顯示,而這時顯示屏?xí)A糁暗膬?nèi)容不變。例如在主線程里添加了阻礙主線程去響應(yīng)點擊、滑動事件、以及阻礙主線程的UI繪制等的代碼,都是造成卡頓的常見原因。

卡頓監(jiān)控:

卡頓監(jiān)控一般有兩種實現(xiàn)方案:

  • (1). 主線程卡頓監(jiān)控。通過子線程監(jiān)測主線程的runLoop,判斷兩個狀態(tài)區(qū)域之間的耗時是否達到一定閾值。

  • (2). FPS監(jiān)控。要保持流暢的UI交互,App 刷新率應(yīng)該當(dāng)努力保持在 60fps。FPS的監(jiān)控實現(xiàn)原理,上面已經(jīng)探討過這里略過。

在使用FPS監(jiān)控性能的實踐過程中,發(fā)現(xiàn) FPS 值抖動較大,造成偵測卡頓比較困難。為了解決這個問題,通過采用檢測主線程每次執(zhí)行消息循環(huán)的時間,當(dāng)這一時間大于規(guī)定的閾值時,就記為發(fā)生了一次卡頓的方式來監(jiān)控。
這也是美團的移動端采用的性能監(jiān)控Hertz 方案,微信團隊也在實踐過程中提出來類似的方案--微信讀書 iOS 性能優(yōu)化總結(jié)。

美團Hertz方案流程圖

方案的提出,是根據(jù)滾動引發(fā)的Sources事件或其它交互事件總是被快速的執(zhí)行完成,然后進入到kCFRunLoopBeforeWaiting狀態(tài)下;假如在滾動過程中發(fā)生了卡頓現(xiàn)象,那么RunLoop必然會保持kCFRunLoopAfterWaiting或者kCFRunLoopBeforeSources這兩個狀態(tài)之一。

所以監(jiān)控主線程卡頓的方案一:

開辟一個子線程,然后實時計算 kCFRunLoopBeforeSources 和 kCFRunLoopAfterWaiting 兩個狀態(tài)區(qū)域之間的耗時是否超過某個閥值,來斷定主線程的卡頓情況。
但是由于主線程的RunLoop在閑置時基本處于Before Waiting狀態(tài),這就導(dǎo)致了即便沒有發(fā)生任何卡頓,這種檢測方式也總能認定主線程處在卡頓狀態(tài)。

為了解決這個問題寒神(南梔傾寒)給出了自己的解決方案,Swift的卡頓檢測第三方ANREye。這套卡頓監(jiān)控方案大致思路為:創(chuàng)建一個子線程進行循環(huán)檢測,每次檢測時設(shè)置標(biāo)記位為YES,然后派發(fā)任務(wù)到主線程中將標(biāo)記位設(shè)置為NO。接著子線程沉睡超時闕值時長,判斷標(biāo)志位是否成功設(shè)置成NO,如果沒有說明主線程發(fā)生了卡頓。

結(jié)合這套方案,當(dāng)主線程處在Before Waiting狀態(tài)的時候,通過派發(fā)任務(wù)到主線程來設(shè)置標(biāo)記位的方式處理常態(tài)下的卡頓檢測:

#define lsl_SEMAPHORE_SUCCESS 0
static BOOL lsl_is_monitoring = NO;
static dispatch_semaphore_t lsl_semaphore;
static NSTimeInterval lsl_time_out_interval = 0.05;


@implementation LSLAppFluencyMonitor

static inline dispatch_queue_t __lsl_fluecy_monitor_queue() {
    static dispatch_queue_t lsl_fluecy_monitor_queue;
    static dispatch_once_t once;
    dispatch_once(&once, ^{
        lsl_fluecy_monitor_queue = dispatch_queue_create("com.dream.lsl_monitor_queue", NULL);
    });
    return lsl_fluecy_monitor_queue;
}

static inline void __lsl_monitor_init() {
    static dispatch_once_t onceToken;
    dispatch_once(&onceToken, ^{
        lsl_semaphore = dispatch_semaphore_create(0);
    });
}

#pragma mark - Public
+ (instancetype)monitor {
    return [LSLAppFluencyMonitor new];
}

- (void)startMonitoring {
    if (lsl_is_monitoring) { return; }
    lsl_is_monitoring = YES;
    __lsl_monitor_init();
    dispatch_async(__lsl_fluecy_monitor_queue(), ^{
        while (lsl_is_monitoring) {
            __block BOOL timeOut = YES;
            dispatch_async(dispatch_get_main_queue(), ^{
                timeOut = NO;
                dispatch_semaphore_signal(lsl_semaphore);
            });
            [NSThread sleepForTimeInterval: lsl_time_out_interval];
            if (timeOut) {
                [LSLBacktraceLogger lsl_logMain];       // 打印主線程調(diào)用棧
//                [LSLBacktraceLogger lsl_logCurrent];    // 打印當(dāng)前線程的調(diào)用棧
//                [LSLBacktraceLogger lsl_logAllThread];  // 打印所有線程的調(diào)用棧
            }
            dispatch_wait(lsl_semaphore, DISPATCH_TIME_FOREVER);
        }
    });
}

- (void)stopMonitoring {
    if (!lsl_is_monitoring) { return; }
    lsl_is_monitoring = NO;
}

@end

其中LSLBacktraceLogger是獲取堆棧信息的類,詳情見代碼Github。

打印日志如下:

2018-08-16 12:36:33.910491+0800 AppPerformance[4802:171145] Backtrace of Thread 771:
======================================================================================
libsystem_kernel.dylib         0x10d089bce __semwait_signal + 10
libsystem_c.dylib              0x10ce55d10 usleep + 53
AppPerformance                 0x108b8b478 $S14AppPerformance25LSLFPSTableViewControllerC05tableD0_12cellForRowAtSo07UITableD4CellCSo0kD0C_10Foundation9IndexPathVtF + 1144
AppPerformance                 0x108b8b60b $S14AppPerformance25LSLFPSTableViewControllerC05tableD0_12cellForRowAtSo07UITableD4CellCSo0kD0C_10Foundation9IndexPathVtFTo + 155
UIKitCore                      0x1135b104f -[_UIFilteredDataSource tableView:cellForRowAtIndexPath:] + 95
UIKitCore                      0x1131ed34d -[UITableView _createPreparedCellForGlobalRow:withIndexPath:willDisplay:] + 765
UIKitCore                      0x1131ed8da -[UITableView _createPreparedCellForGlobalRow:willDisplay:] + 73
UIKitCore                      0x1131b4b1e -[UITableView _updateVisibleCellsNow:isRecursive:] + 2863
UIKitCore                      0x1131d57eb -[UITableView layoutSubviews] + 165
UIKitCore                      0x1133921ee -[UIView(CALayerDelegate) layoutSublayersOfLayer:] + 1501
QuartzCore                     0x10ab72eb1 -[CALayer layoutSublayers] + 175
QuartzCore                     0x10ab77d8b _ZN2CA5Layer16layout_if_neededEPNS_11TransactionE + 395
QuartzCore                     0x10aaf3b45 _ZN2CA7Context18commit_transactionEPNS_11TransactionE + 349
QuartzCore                     0x10ab285b0 _ZN2CA11Transaction6commitEv + 576
QuartzCore                     0x10ab29374 _ZN2CA11Transaction17observer_callbackEP19__CFRunLoopObservermPv + 76
CoreFoundation                 0x109dc3757 __CFRUNLOOP_IS_CALLING_OUT_TO_AN_OBSERVER_CALLBACK_FUNCTION__ + 23
CoreFoundation                 0x109dbdbde __CFRunLoopDoObservers + 430
CoreFoundation                 0x109dbe271 __CFRunLoopRun + 1537
CoreFoundation                 0x109dbd931 CFRunLoopRunSpecific + 625
GraphicsServices               0x10f5981b5 GSEventRunModal + 62
UIKitCore                      0x112c812ce UIApplicationMain + 140
AppPerformance                 0x108b8c1f0 main + 224
libdyld.dylib                  0x10cd4dc9d start + 1

======================================================================================

方案二是結(jié)合CADisplayLink的方式實現(xiàn)

在檢測FPS值的時候,我們就詳細介紹了CADisplayLink的使用方式,在這里也可以通過FPS值是否連續(xù)低于某個值開進行監(jiān)控。

后續(xù)

關(guān)于更多APP性能監(jiān)控的內(nèi)容,包括網(wǎng)絡(luò)狀況監(jiān)控、啟動時閃退使用時崩潰、耗電量監(jiān)控、流量監(jiān)控等等,由于篇幅太長,將作為第二篇文中發(fā)出,歡迎交流探討。

文中所提的所以實例代碼:

Github

相關(guān)文章:

今日頭條iOS客戶端啟動速度優(yōu)化
騰訊--iOS APP 性能檢測
iOS查看屏幕幀數(shù)工具--YYFPSLabel
YYKit
美團--移動端性能監(jiān)控方案Hertz
YYKit 作者--iOS 保持界面流暢的技巧
“sindri的小巢”的(iOS監(jiān)控-卡頓檢測)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 作者:敖志敏本文為原創(chuàng)文章,轉(zhuǎn)載請注明作者及出處 為什么寫這篇文章? 隨著移動互聯(lián)網(wǎng)向縱深發(fā)展,用戶變得越來越關(guān)心...
    滬江技術(shù)學(xué)院閱讀 6,269評論 2 83
  • 前言 眾所周知,如今的用戶變得越來越關(guān)心app的體驗,開發(fā)者必須關(guān)注應(yīng)用性能所帶來的用戶流失問題。目前危害較大的性...
    PerTerbin閱讀 9,854評論 5 32
  • 概述 RunLoop作為iOS中一個基礎(chǔ)組件和線程有著千絲萬縷的關(guān)系,同時也是很多常見技術(shù)的幕后功臣。盡管在平時多...
    陽明AI閱讀 1,151評論 0 17
  • 最近看了很多RunLoop的文章,看完很懵逼,決心整理一下,文章中大部分內(nèi)容都是引用大神們的,但好歹對自己有個交代...
    小涼介閱讀 6,955評論 12 79
  • 1.ios高性能編程 (1).內(nèi)層 最小的內(nèi)層平均值和峰值(2).耗電量 高效的算法和數(shù)據(jù)結(jié)構(gòu)(3).初始化時...
    歐辰_OSR閱讀 30,192評論 8 265

友情鏈接更多精彩內(nèi)容