Crash監(jiān)控-Java&NDK

Crash(應(yīng)用崩潰)是由于代碼異常而導(dǎo)致 App 非正常退出,導(dǎo)致應(yīng)用程序無(wú)法繼續(xù)使用,所有工作都 停止的現(xiàn)象。發(fā)生 Crash 后需要重新啟動(dòng)應(yīng)用(有些情況會(huì)自動(dòng)重啟),而且不管應(yīng)用在開(kāi)發(fā)階段做得 多么優(yōu)秀,也無(wú)法避免 Crash 發(fā)生,特別是在 Android 系統(tǒng)中,系統(tǒng)碎片化嚴(yán)重、各 ROM 之間的差 異,甚至系統(tǒng)Bug,都可能會(huì)導(dǎo)致Crash的發(fā)生。
在 Android 應(yīng)用中發(fā)生的 Crash 有兩種類型,Java 層的 Crash 和 Native 層 Crash。這兩種Crash 的監(jiān) 控和獲取堆棧信息有所不同。

Java Crash

Java的Crash監(jiān)控非常簡(jiǎn)單,Java中的Thread定義了一個(gè)接口: ;用于 處理未捕獲的異常導(dǎo)致線程的終止(注意:catch了的是捕獲不到的),當(dāng)我們的應(yīng)用crash的時(shí)候,就 會(huì)走 UncaughtExceptionHandler.uncaughtException ,在該方法中可以獲取到異常的信息,我們通 過(guò) Thread.setDefaultUncaughtExceptionHandler 該方法來(lái)設(shè)置線程的默認(rèn)異常處理器,我們可以 將異常信息保存到本地或者是上傳到服務(wù)器,方便我們快速的定位問(wèn)題。

public class CrashHandler implements Thread.UncaughtExceptionHandler {
    private static final String FILE_NAME_SUFFIX = ".trace";
    private static Thread.UncaughtExceptionHandler mDefaultCrashHandler;
    private static Context mContext;

    private CrashHandler() {
    }

    public static void init(@NonNull Context context) { //默認(rèn)為:RuntimeInit#KillApplicationHandler
        mDefaultCrashHandler = Thread.getDefaultUncaughtExceptionHandler();
        Thread.setDefaultUncaughtExceptionHandler(this);
        mContext = context.getApplicationContext();
    }

    /**
     * 當(dāng)程序中有未被捕獲的異常,系統(tǒng)將會(huì)調(diào)用這個(gè)方法 *
     *
     * @param t 出現(xiàn)未捕獲異常的線程
     * @param e 得到異常信息
     */
    @Override
    public void uncaughtException(Thread t, Throwable e) {
        try {
//自行處理:保存本地
            File file = dealException(e); //上傳服務(wù)器
//......
        } catch (Exception e1) {
            e1.printStackTrace();
        } finally { //交給系統(tǒng)默認(rèn)程序處理
            if (mDefaultCrashHandler != null) {
                mDefaultCrashHandler.uncaughtException(t, e);
            }
        }
    }

    /**
     * 導(dǎo)出異常信息到SD卡 *
     *
     * @param e
     */
    private File dealException(Thread t, Throwable e) throws Exception {
        String time = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new
                Date());
        File f = new
                File(context.getExternalCacheDir().getAbsoluteFile(), "crash_info");
        if (!f.exists()) {
            f.mkdirs();
        }
        File crashFile = new File(f, time + FILE_NAME_SUFFIX);
        File file = new File(PATH + File.separator + time + FILE_NAME_SUFFIX);
//往文件中寫(xiě)入數(shù)據(jù)
        PrintWriter pw = new PrintWriter(new BufferedWriter(new FileWriter(file)));
        pw.println(time);
        pw.println("Thread: " + t.getName());
        try {
            pw.println(getPhoneInfo());
        } catch (PackageManager.NameNotFoundException e) {
            e.printStackTrace();
        }
        e.printStackTrace(pw); //寫(xiě)入crash堆棧 
        pw.close();
        return file;
    }

    private String getPhoneInfo() throws PackageManager.NameNotFoundException {
        PackageManager pm = mContext.getPackageManager();
        PackageInfo pi = pm.getPackageInfo(mContext.getPackageName(),
                PackageManager.GET_ACTIVITIES);
        StringBuilder sb = new StringBuilder(); //App版本
        sb.append("App Version: ");
        sb.append(pi.versionName);
        sb.append("_");
        sb.append(pi.versionCode + "\n");
//Android版本號(hào)
        sb.append("OS Version: ");
        sb.append(Build.VERSION.RELEASE);
        sb.append("_");
        sb.append(Build.VERSION.SDK_INT + "\n");
//手機(jī)制造商
        sb.append("Vendor: ");
        sb.append(Build.MANUFACTURER + "\n");
//手機(jī)型號(hào)
        sb.append("Model: ");
        sb.append(Build.MODEL + "\n");

        //CPU架構(gòu)
        sb.append("CPU: ");
        if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.LOLLIPOP) {
            sb.append(Arrays.toString(Build.SUPPORTED_ABIS));
        } else {
            sb.append(Build.CPU_ABI);
        }
        return sb.toString();
    }
}

NDK Crash

相對(duì)于Java的Crash,NDK的錯(cuò)誤無(wú)疑更加讓人頭疼,特別是對(duì)初學(xué)NDK的同學(xué),不說(shuō)監(jiān)控,就算是錯(cuò) 誤堆棧都不知道怎么看。

Linux信號(hào)機(jī)制

信號(hào)機(jī)制是Linux進(jìn)程間通信的一種重要方式,Linux信號(hào)一方面用于正常的進(jìn)程間通信和同步,另一方 面它還負(fù)責(zé)監(jiān)控系統(tǒng)異常及中斷。當(dāng)應(yīng)用程序運(yùn)行異常時(shí),Linux內(nèi)核將產(chǎn)生錯(cuò)誤信號(hào)并通知當(dāng)前進(jìn) 程。當(dāng)前進(jìn)程在接收到該錯(cuò)誤信號(hào)后,可以有三種不同的處理方式。

  • 忽略該信號(hào);
  • 捕捉該信號(hào)并執(zhí)行對(duì)應(yīng)的信號(hào)處理函數(shù)(信號(hào)處理程序);
  • 執(zhí)行該信號(hào)的缺省操作(如終止進(jìn)程)

當(dāng)Linux應(yīng)用程序在執(zhí)行時(shí)發(fā)生嚴(yán)重錯(cuò)誤,一般會(huì)導(dǎo)致程序崩潰。其中,Linux專門提供了一類crash信 號(hào),在程序接收到此類信號(hào)時(shí),缺省操作是將崩潰的現(xiàn)場(chǎng)信息記錄到核心文件,然后終止進(jìn)程。

常見(jiàn)崩潰信號(hào)列表:

信號(hào) 描述
SIGSEGV 內(nèi)存引用無(wú)效。
SIGBUS 訪問(wèn)內(nèi)存對(duì)象的未定義部分。
SIGFPE 算術(shù)運(yùn)算錯(cuò)誤,除以零。
SIGILL 非法指令,如執(zhí)行垃圾或特權(quán)指令
SIGSYS 糟糕的系統(tǒng)調(diào)用
SIGXCPU 超過(guò)CPU時(shí)間限制。
SIGXFSZ 文件大小限制。

一般的出現(xiàn)崩潰信號(hào),Android系統(tǒng)默認(rèn)缺省操作是直接退出我們的程序。但是系統(tǒng)允許我們給某一個(gè) 進(jìn)程的某一個(gè)特定信號(hào)注冊(cè)一個(gè)相應(yīng)的處理函數(shù)(signal),即對(duì)該信號(hào)的默認(rèn)處理動(dòng)作進(jìn)行修改。因 此NDK Crash的監(jiān)控可以采用這種信號(hào)機(jī)制,捕獲崩潰信號(hào)執(zhí)行我們自己的信號(hào)處理函數(shù)從而捕獲NDK Crash。

墓碑

此處了解即可,普通應(yīng)用無(wú)權(quán)限讀取墓碑文件,墓碑文件位于路徑/data/tombstones/下。解析墓 碑文件與后面的breakPad都可使用 addr2line 工具。

Android本機(jī)程序本質(zhì)上就是一個(gè)Linux程序,當(dāng)它在執(zhí)行時(shí)發(fā)生嚴(yán)重錯(cuò)誤,也會(huì)導(dǎo)致程序崩潰,然后產(chǎn) 生一個(gè)記錄崩潰的現(xiàn)場(chǎng)信息的文件,而這個(gè)文件在Android系統(tǒng)中就是 tombstones 墓碑文件。

BreakPad

Google breakpad是一個(gè)跨平臺(tái)的崩潰轉(zhuǎn)儲(chǔ)和分析框架和工具集合,其開(kāi)源地址是:https://github.co m/google/breakpad。breakpad在Linux中的實(shí)現(xiàn)就是借助了Linux信號(hào)捕獲機(jī)制實(shí)現(xiàn)的。因?yàn)槠鋵?shí)現(xiàn) 為C++,因此在Android中使用,必須借助NDK工具。

引入項(xiàng)目

將Breakpad源碼下載解壓,首先查看README.ANDROID文件。

打開(kāi) README.ANDROID

crash1.png

按照文檔中的介紹,如果我們使用Android.mk 非常簡(jiǎn)單就能夠引入到我們工程中,但是目前NDK默認(rèn) 的構(gòu)建工具為:CMake,因此我們做一次移植。查看android/google_breakpad/Android.mk

LOCAL_PATH := $(call my-dir)/../..
include $(CLEAR_VARS)
#最后編譯出 
libbreakpad_client.a LOCAL_MODULE := breakpad_client 
#指定c++源文件后綴名 LOCAL_CPP_EXTENSION := .cc
# 強(qiáng)制構(gòu)建系統(tǒng)以 32 位 arm 模式生成模塊的對(duì)象文件 LOCAL_ARM_MODE := arm
# 需要編譯的源碼 LOCAL_SRC_FILES := \
src/client/linux/crash_generation/crash_generation_client.cc \ src/client/linux/dump_writer_common/thread_info.cc \ src/client/linux/dump_writer_common/ucontext_reader.cc \ src/client/linux/handler/exception_handler.cc \ src/client/linux/handler/minidump_descriptor.cc \ src/client/linux/log/log.cc \ src/client/linux/microdump_writer/microdump_writer.cc \ src/client/linux/minidump_writer/linux_dumper.cc \ src/client/linux/minidump_writer/linux_ptrace_dumper.cc \ src/client/linux/minidump_writer/minidump_writer.cc \ src/client/minidump_file_writer.cc \ src/common/convert_UTF.cc \
src/common/md5.cc \ src/common/string_conversion.cc \ src/common/linux/breakpad_getcontext.S \ src/common/linux/elfutils.cc \ src/common/linux/file_id.cc \ src/common/linux/guid_creator.cc \ src/common/linux/linux_libc_support.cc \ src/common/linux/memory_mapped_file.cc \ src/common/linux/safe_readlink.cc

#導(dǎo)入頭文件
LOCAL_C_INCLUDES := $(LOCAL_PATH)/src/common/android/include \
$(LOCAL_PATH)/src \ $(LSS_PATH) #注意這個(gè)目錄
#導(dǎo)出頭文件
LOCAL_EXPORT_C_INCLUDES := $(LOCAL_C_INCLUDES) 
#使用android ndk中的日志庫(kù)log 
LOCAL_EXPORT_LDLIBS := -llog
#編譯static靜態(tài)庫(kù)-》類似java的jar包 
include $(BUILD_STATIC_LIBRARY)

注意:mk文件中 LOCAL_C_INCLUDES 的 LSS_PATH

對(duì)照Android.mk文件,我們?cè)谧约喉?xiàng)目的cpp(工程中C/C++源碼)目錄下創(chuàng)建breakpad目錄,并將下載
的breakpad源碼根目錄下的src目錄全部復(fù)制到我們的項(xiàng)目中:

crash2.png

接下來(lái)在breakpad目錄下創(chuàng)建CMakeList.txt文件:

cmake_minimum_required(VERSION 3.4.1) 
#對(duì)應(yīng)android.mk中的 LOCAL_C_INCLUDES include_directories(src src/common/android/include) 
#開(kāi)啟arm匯編支持,因?yàn)樵谠创a中有 .S文件(匯編源碼) enable_language(ASM)
#生成 libbreakpad.a 并指定源碼,對(duì)應(yīng)android.mk中 LOCAL_SRC_FILES+LOCAL_MODULE add_library(breakpad STATIC

src/client/linux/crash_generation/crash_generation_client.cc src/client/linux/dump_writer_common/thread_info.cc src/client/linux/dump_writer_common/ucontext_reader.cc src/client/linux/handler/exception_handler.cc
src/client/linux/handler/minidump_descriptor.cc src/client/linux/log/log.cc src/client/linux/microdump_writer/microdump_writer.cc src/client/linux/minidump_writer/linux_dumper.cc src/client/linux/minidump_writer/linux_ptrace_dumper.cc src/client/linux/minidump_writer/minidump_writer.cc src/client/minidump_file_writer.cc src/common/convert_UTF.cc
src/common/md5.cc src/common/string_conversion.cc src/common/linux/breakpad_getcontext.S src/common/linux/elfutils.cc src/common/linux/file_id.cc src/common/linux/guid_creator.cc src/common/linux/linux_libc_support.cc src/common/linux/memory_mapped_file.cc src/common/linux/safe_readlink.cc)

#鏈接 log庫(kù),對(duì)應(yīng)android.mk中 LOCAL_EXPORT_LDLIBS target_link_libraries(breakpad log)

在cpp目錄下(breakpad同級(jí))還有一個(gè)CMakeList.txt文件,它的內(nèi)容是:

cmake_minimum_required(VERSION 3.4.1)
#引入breakpad的頭文件(api的定義)
include_directories(breakpad/src breakpad/src/common/android/include) 
#引入breakpad的cmakelist,執(zhí)行并生成libbreakpad.a (api的實(shí)現(xiàn),類似java的jar包) add_subdirectory(breakpad)
#生成libbugly.so 源碼是:ndk_crash.cpp(我們自己的源碼,要使用breakpad) 
add_library(
bugly
SHARED ndk_crash.cpp)
target_link_libraries(
        bugly
breakpad #引入breakpad的庫(kù)文件(api的實(shí)現(xiàn)) 
log)

此時(shí)執(zhí)行編譯,會(huì)在 #include "third_party/lss/linux_syscall_support.h" 報(bào)錯(cuò),無(wú)法找到頭 文件。此文件從:https://chromium.googlesource.com/external/linux-syscall-support/+/refs/head s/master 下載放到工程對(duì)應(yīng)目錄即可。

ndk_crash.cpp 源文件中的實(shí)現(xiàn)為:

#include <jni.h> 
#include <android/log.h>
#include "breakpad/src/client/linux/handler/minidump_descriptor.h" 
#include 
"breakpad/src/client/linux/handler/exception_handler.h"

bool DumpCallback(const google_breakpad::MinidumpDescriptor &descriptor,
                  void *context,
                  bool succeeded) {
    __android_log_print(ANDROID_LOG_ERROR, "ndk_crash", "Dump path: %s",
descriptor.path()); //如果回調(diào)返回true,Breakpad將把異常視為已完全處理,禁止任何其他處理程序收到異常通知。 //如果回調(diào)返回false,Breakpad會(huì)將異常視為未處理,并允許其他處理程序處理它。
return false;
}
extern "C"
JNIEXPORT void JNICALL
Java_com_enjoy_crash_CrashReport_initBreakpad(JNIEnv *env, jclass type, jstring
path_) {
const char *path = env->GetStringUTFChars(path_, 0);
//開(kāi)啟crash監(jiān)控
google_breakpad::MinidumpDescriptor descriptor(path);
static google_breakpad::ExceptionHandler eh(descriptor, NULL, DumpCallback,
NULL, true, -1); env->ReleaseStringUTFChars(path_, path);
}
//測(cè)試用
extern "C"
JNIEXPORT void JNICALL Java_com_enjoy_crash_CrashReport_testNativeCrash(JNIEnv *env, jclass clazz) {
int *i = NULL;
*i = 1; }

注意JNI方法的方法名對(duì)應(yīng)了java類,創(chuàng)建Java源文件: com.enjoy.crash.CrashReport


import android.content.Context; import java.io.File;
public class CrashReport {
static { System.loadLibrary("bugly");
}
public static void init(Context context) { //開(kāi)啟java監(jiān)控
Context applicationContext = context.getApplicationContext(); CrashHandler.init(applicationContext);
//開(kāi)啟ndk監(jiān)控
File file = new File(context.getExternalCacheDir(), "native_crash"); if (!file.exists()) {

file.mkdirs(); }
initBreakpad(file.getAbsolutePath()); }
    // C++: Java_com_enjoy_crash_CrashReport_initBreakpad
    private static native void initBreakpad(String path);
    // C++: Java_com_enjoy_crash_CrashReport_testNativeCrash
    public static native void testNativeCrash();
    public static int testJavaCrash() {
        return 1 / 0;
} }

此時(shí),如果出現(xiàn)NDK Crash,會(huì)在我們指定的目
錄: /sdcard/Android/Data/[packageName]/cache/native_crash 下生成NDK Crash信息文件。

Crash解析

采集到的Crash信息記錄在minidump文件中。minidump是由微軟開(kāi)發(fā)的用于崩潰上傳的文件格式。我 們可以將此文件上傳到服務(wù)器完成上報(bào),但是此文件沒(méi)有可讀性可言,要將文件解析為可讀的崩潰堆棧 需要按照breakpad文檔編譯 工具,而Windows系統(tǒng)編譯個(gè)人不會(huì)。不過(guò)好在, 無(wú)論你是 Mac、windows還是ubuntu在 Android Studio 的安裝目錄下的 bin\lldb\bin 里面就存在一 個(gè)對(duì)應(yīng)平臺(tái)的 。

crash3.png

使用這里的工具執(zhí)行:

minidump_stackwalk xxxx.dump > crash.txt

打開(kāi)crash.txt 內(nèi)容為:

Operating system: Android
0.0.0 Linux 4.4.124+ #1 SMP PREEMPT Wed Jan 30 07:13:09 UTC
2019 i686
CPU: x86 // abi類型
     GenuineIntel family 6 model 31 stepping 1
     3 CPUs
GPU: UNKNOWN
Crash reason: SIGSEGV //內(nèi)存引用無(wú)效 信號(hào) Crash address: 0x0
Process uptime: not available
Thread 0 (crashed) //crashed:出現(xiàn)crash的線程
0 libbugly.so + 0x1feab //crash的so與寄存器信息
eip = 0xd5929eab
esi = 0xd71a3f04
edx = 0x00000000
Found by: given as instruction pointer in context
ebx = 0x0000000c
ecx = 0xefb19400
esp = 0xffa85f30   ebp = 0xffa85f38
edi = 0xffa86128   eax = 0xffa85f5c
efl = 0x00210286
1 libart.so + 0x5f6a18
eip = 0xef92ea18 esp = 0xffa85f40 ebp = 0xffa85f60 Found by: previous frame's frame pointer
Thread 1 ......

接下來(lái)使用 Android NDK 里面提供的 addr2line 工具將寄存器地址轉(zhuǎn)換為對(duì)應(yīng)符號(hào)。addr2line 要用和 自己 so 的 ABI 匹配的目錄,同時(shí)需要使用有符號(hào)信息的so(一般debug的就有)。

因?yàn)槲沂褂玫氖悄M器x86架構(gòu),因此addr2line位于:
Android\Sdk\ndk\21.3.6528147\toolchains\x86-4.9\prebuilt\windows-x86_64\bin\i686-linux- android-addr2line.exe

i686-linux-android-addr2line.exe -f -C -e libbugly.so 0x1feab
crash4.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過(guò)簡(jiǎn)信或評(píng)論聯(lián)系作者。

友情鏈接更多精彩內(nèi)容