iOS 崩潰信息收集實踐

iOS 崩潰信息收集

最近項目要求收集應用使用過程中的崩潰信息,在網上搜索了一番后,了解目前崩潰信息收集有如下幾種途徑:iTunes Connect導出手機上傳日志、拿到用戶手機使用 Xcode 導出、使用第三方崩潰收集服務(如 Bugly、友盟等)。從及時性和可定制角度來看上面幾種都不符合項目的需求,基于上述需求背景要求必須學習手動收集崩潰信息。

導致崩潰的問題

導致應用崩潰的問題主要有兩種:

  1. C++語言層面的錯誤,比如野指針、除零、內存非法訪問等;
  2. 未捕獲異常(Uncaught Exception),在 iOS 中最常見的就是通過 @throw 拋出的 NSException(常見的錯誤,比如數組訪問越界)

對于第一種問題,由于 iOS 和 Android 底層系統都是 Unix 或者類 Unix 系統,可以采用信號機制來捕獲 signal 或 sigaction,通過設置的回調函數來收集信號的上下文信息。

第二種問題可以通過 NSSetUncaughtExceptionHandler 設置異常處理回調函數來收集異常的調用堆棧。

收集崩潰的上下文信息

使用 NSUncaughtExceptionHandler 捕獲 NSException

通過 void NSSetUncaughtExceptionHandler(NSUncaughtExceptionHandler *) 函數設置異常發生時對應的事件處理函數,NSUncaughtExceptionHandler 是一個函數指針 typedef void NSUncaughtExceptionHandler(NSException *exception),該函數指針的入參是 NSException,包含該異常的調用堆棧:

void InstallUncaughtExceptionHandler(void) {
    // Backup original handler
    g_previousUncaughtExceptionHandler = NSGetUncaughtExceptionHandler();

    NSSetUncaughtExceptionHandler(&HandleException);
}

void MyUncaughtExceptionHandler(NSException *exception) {
    // 異常的堆棧信息
    NSArray *stackArray = [exception callStackSymbols];
    // 出現異常的原因
    NSString *reason = [exception reason];
    // 異常名稱
    NSString *name = [exception name];
    NSString *exceptionInfo = [NSString stringWithFormat:@"Exception reason:%@\nException name:%@\nException stack:%@",name, reason, stackArray];
    NSLog(@"%@", exceptionInfo);
    [UncaughtExceptionHandler saveCreash:exceptionInfo];
    
    if (g_previousUncaughtExceptionHandler != NULL) {
        g_previousUncaughtExceptionHandler(exception);
    }
}

上面是捕獲異常的簡單示例。

捕獲 Signal 信號

Signal 信號是 Unix 系統中一種用于異步通知的機制。信號傳遞給進程后,在沒有設置處理函數的情況下,程序可以指定三種行為:

  1. 忽略信號,但 SIGKILL 和 SIGSTOP 信號不可忽略;
  2. 使用默認的處理函數 SIG_DFL,大多數信號的默認動作是終止進程;
  3. 捕獲信號,執行用戶定義的函數。

這里有兩個特殊的常量:

  • SIG_IGN:向內核表示忽略此信號。對于不能忽略的兩個信號SIGKILL和SIGSTOP,調用時會報錯;
  • SIG_DFL:執行該信號的系統默認動作.

常用函數:

  • int kill(pid_t pid, int signo) 發送信號到指定的進程
  • int raise(int signo) 發送信號給自己

Unix 系統中常見信號有如下幾種:

SIGABRT--程序中止命令中止信號 
SIGALRM--程序超時信號 
SIGFPE--程序浮點異常信號
SIGILL--程序非法指令信號
SIGHUP--程序終端中止信號
SIGINT--程序鍵盤中斷信號 
SIGKILL--程序結束接收中止信號 
SIGTERM--程序kill中止信號 
SIGSTOP--程序鍵盤中止信號  
SIGSEGV--程序無效內存中止信號 
SIGBUS--程序內存字節未對齊中止信號 
SIGPIPE--程序Socket發送失敗中止信號

會導致程序被殺掉的有下面幾種,我們只需收集這幾種信號的上下文信息,就能找到崩潰發生原因。

SIGABRT,
SIGBUS,
SIGFPE,
SIGILL,
SIGSEGV,
SIGTRAP,
SIGTERM,
SIGKILL,

信號處理流程分三步:

  1. 注冊信號處理回調函數;
  2. 在回調函數中收集調用堆棧信息;
  3. 恢復信號默認處理函數;

1.注冊信號處理回調函數

static int Beacon_errorSignals[] = {
    SIGABRT,
    SIGBUS,
    SIGFPE,
    SIGILL,
    SIGSEGV,
    SIGTRAP,
    SIGTERM,
    SIGKILL,
};
for (int i = 0; i < Beacon_errorSignalsNum; i++) {
    signal(Beacon_errorSignals[i], &SignalExceptionHandler);
}

2.回調函數中收集調用堆棧信息

void SignalExceptionHandler(int sig) {
    NSMutableString *mstr = [[NSMutableString alloc] init];
    [mstr appendString:@"Stack:\n"];
    void *callstack[128];
    int i, frames = backtrace(callstack, 128);
    char **strs = backtrace_symbols(callstack, frames);
    for (i = 0; i <frames; ++i) {
        [mstr appendFormat:@"%s\n", strs[i]];
    }
    [SignalHandler saveCreash:mstr];
    free(strs);
}

3.恢復信號默認處理函數

但這里會將信號不斷的發向該處理函數,導致應用無法正常崩潰,因為一般的消息處理會向進程終結,但是這里沒有,所以還會有同樣地信號不斷的發過來并被處理.所以處理函數后要終結該處理函數的處理,并將其由系統默認處理,即:

signal(sig, SIG_DFL);

測試

完成異常和信號處理函數的設置后,我們需要測試設置是否生效,能否正常捕獲到崩潰的堆棧信息。測試需要注意:信號時不能在 debug 環境下進行,系統的 debug 會優先攔截信號。正確的測試姿勢,安裝應用后關閉 debug,直接在模擬器中點擊應用制造信號。Exception 測試可以在 debug 環境下進行。

- (IBAction)buttonClick:(UIButton *)sender {
    //1.信號量
    Test *pTest = {1,2};
    free(pTest); //導致SIGABRT的錯誤,因為內存中根本就沒有這個空間,哪來的free,就在棧中的對象而已
    pTest->a = 5;
}

- (IBAction)buttonOCException:(UIButton *)sender {
    //2.ios崩潰
    NSArray *array= @[@"tom",@"xxx",@"ooo"];
    [array objectAtIndex:5];
}

收集后的清理

傳遞 UncaughtExceptionHandler

如果多方通過 NSSetUncaughtExceptionHandler 注冊異常處理程序,后注冊的異常處理程序會覆蓋前一個注冊的 handler,導致之前注冊的日志收集服務收不到相應的 NSException,丟失崩潰堆棧信息。(iOS 系統自帶的 Crash Reporter 不受影響)。

崩潰后友好退出

而對于有些時候,在iOS中,在應用崩潰后,保持運行狀態而不退出:

CFRunLoopRef runLoop = CFRunLoopGetCurrent();
CFArrayRef allModes = CFRunLoopCopyAllModes(runLoop);

while (!dismissed) {
    for (NSString *mode in (__bridge NSArray *)allModes) {
        CFRunLoopRunInMode((__bridge CFStringRef)mode, 0.001, false);
    }
}

CFRelease(allModes);

應用以上代碼,可以做到崩潰時彈框提示應用,以讓用戶還是可以正常操作,讓響應更加友好.

存在的問題

使用上述方式收集到的堆棧信息只包含錯誤線程,其他線程的調用堆棧無法獲取。而在一些 Signal 的出錯信息僅靠崩潰線程的堆棧無法找到原因,需同時根據其他線程調用堆棧來尋找崩潰原因。

目前成熟的開源崩潰日志收集服務有很多,如 KSCrash,PLCrashReporter,CrashKit 等,使用一番后覺得 PLCrashReporter 更符合項目要求。PL 收集崩潰日志信息和蘋果官方日志兼容,擴展性較好,與已有服務銜接較為簡單。

集成 PLCrashReporter

官網下載最新的 release 包,將iOS Framework/CrashReporter.framework 拖進工程。在 application:didFinishLaunchingWithOptions 方法中調用 initCrashMgr 完成 PLCrashReporter 的初始化。

- (void)initCrashMgr {
    PLCrashReporter *crashReporter = [PLCrashReporter sharedReporter];
    NSError *error;
    // Check if we previously crashed
    if ([crashReporter hasPendingCrashReport]) {
        [self handleCrashReport];
    }
    // Enable the Crash Reporter
    if (![crashReporter enableCrashReporterAndReturnError: &error]) {
        ABLog(@"Warning: Could not enable crash reporter: %@", error);
    }
}

- (void)handleCrashReport {
    PLCrashReporter *crashReporter = [PLCrashReporter sharedReporter];
    NSData *crashData;
    NSError *error;
    
    // Try loading the crash report
    crashData = [crashReporter loadPendingCrashReportDataAndReturnError:&error];
    if (crashData == nil) {
        ABLog(@"Could not load crash report: %@", error);
        [crashReporter purgePendingCrashReport];
        return;
    }
    
    // We could send the report from here, but we'll just print out some debugging info instead
    PLCrashReport *report = [[PLCrashReport alloc] initWithData:crashData error:&error];
    if (report == nil) {
        ABLog(@"Could not parse crash report");
        [crashReporter purgePendingCrashReport];
        return;
    }
    
    //TODO:send the report
    ABLog(@"Crashed on %@", report.systemInfo.timestamp);
    ABLog(@"Crashed with signal %@ (code %@, address=0x%" PRIx64 ")", report.signalInfo.name, report.signalInfo.code, report.signalInfo.address);
    NSString *humanReadText = [PLCrashReportTextFormatter stringValueForCrashReport:report withTextFormat:PLCrashReportTextFormatiOS];
    
    // 處理收集到的 crash 信息
    [self sendCrashReport:humanReadText];
    
    [crashReporter purgePendingCrashReport];
    return;
}

PLCrashReporter 收集的 crash 非常全媲美蘋果的收集的日志,簡單看了下源碼原理和上述思路一致,但一直沒找到它如何解決其他線程的堆棧收集問題,有時間繼續研讀下。

參考文章:

iOS崩潰信息收集
iOS異常捕獲
漫談iOS Crash收集框架

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,748評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,165評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,595評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,633評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,435評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,943評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,035評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,175評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,713評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,599評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,788評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,303評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,034評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,412評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,664評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,408評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,747評論 2 370

推薦閱讀更多精彩內容