Android ANR:原理分析及解決辦法

image.png

一、ANR說明和原因

1.1 簡介

ANR全稱:Application Not Responding,也就是應用程序無響應。

1.2 原因

Android系統中,ActivityManagerService(簡稱AMS)WindowManagerService(簡稱WMS)會檢測App的響應時間,如果App在特定時間無法相應屏幕觸摸或鍵盤輸入時間,或者特定事件沒有處理完畢,就會出現ANR。

以下四個條件都可以造成ANR發生:

  • InputDispatching Timeout:5秒內無法響應屏幕觸摸事件或鍵盤輸入事件
  • BroadcastQueue Timeout :在執行前臺廣播(BroadcastReceiver)的onReceive()函數時10秒沒有處理完成,后臺為60秒。
  • Service Timeout :前臺服務20秒內,后臺服務在200秒內沒有執行完畢。
  • ContentProvider Timeout :ContentProvider的publish在10s內沒進行完。

1.3 避免

盡量避免在主線程(UI線程)中作耗時操作。

那么耗時操作就放在子線程中。
關于多線程可以參考:Android多線程:理解和簡單使用總結

二、ANR分析辦法

2.1 ANR重現

這里使用的是號稱Google親兒子的Google Pixel xl(Android 8.0系統)做的測試,生成一個按鈕跳轉到ANRTestActivity,在后者的onCreate()中主線程休眠20秒:

@Override
protected void onCreate(@Nullable Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_anr_test);
    // 這是Android提供線程休眠函數,與Thread.sleep()最大的區別是
    // 該使用該函數不會拋出InterruptedException異常。
    SystemClock.sleep(20 * 1000);
}

在進入ANRTestActivity后黑屏一段時間,大概有七八秒,終于彈出了ANR異常。

image

2.2 ANR分析辦法一:Log

剛才產生ANR后,看下Log:

image

可以看到logcat清晰地記錄了ANR發生的時間,以及線程的tid和一句話概括原因:WaitingInMainSignalCatcherLoop,大概意思為主線程等待異常。
最后一句The application may be doing too much work on its main thread.告知可能在主線程做了太多的工作。

2.3 ANR分析辦法二:traces.txt

剛才的log有第二句Wrote stack traces to '/data/anr/traces.txt',說明ANR異常已經輸出到traces.txt文件,使用adb命令把這個文件從手機里導出來:

  1. cd到adb.exe所在的目錄,也就是Android SDKplatform-tools目錄,例如:
cd D:\Android\AndroidSdk\platform-tools

此外,除了Windows的cmd以外,還可以使用AndroidStudioTerminal來輸入adb命令。

  1. 到指定目錄后執行以下adb命令導出traces.txt文件:
adb pull /data/anr/traces.txt

traces.txt默認會被導出到Android SDK\platform-tools目錄。一般來說traces.txt文件記錄的東西會比較多,分析的時候需要有針對性地去找相關記錄。

----- pid 23346 at 2017-11-07 11:33:57 -----  ----> 進程id和ANR產生時間
Cmd line: com.sky.myjavatest
Build fingerprint: 'google/marlin/marlin:8.0.0/OPR3.170623.007/4286350:user/release-keys'
ABI: 'arm64'
Build type: optimized
Zygote loaded classes=4681 post zygote classes=106
Intern table: 42675 strong; 137 weak
JNI: CheckJNI is on; globals=526 (plus 22 weak)
Libraries: /system/lib64/libandroid.so /system/lib64/libcompiler_rt.so 
/system/lib64/libjavacrypto.so
/system/lib64/libjnigraphics.so /system/lib64/libmedia_jni.so /system/lib64/libsoundpool.so
/system/lib64/libwebviewchromium_loader.so libjavacore.so libopenjdk.so (9)
Heap: 22% free, 1478KB/1896KB; 21881 objects    ----> 內存使用情況

...

"main" prio=5 tid=1 Sleeping    ----> 原因為Sleeping
  | group="main" sCount=1 dsCount=0 flags=1 obj=0x733d0670 self=0x74a4abea00
  | sysTid=23346 nice=-10 cgrp=default sched=0/0 handle=0x74a91ab9b0
  | state=S schedstat=( 391462128 82838177 354 ) utm=33 stm=4 core=3 HZ=100
  | stack=0x7fe6fac000-0x7fe6fae000 stackSize=8MB
  | held mutexes=
  at java.lang.Thread.sleep(Native method)
  - sleeping on <0x053fd2c2> (a java.lang.Object)
  at java.lang.Thread.sleep(Thread.java:373)
  - locked <0x053fd2c2> (a java.lang.Object)
  at java.lang.Thread.sleep(Thread.java:314)
  at android.os.SystemClock.sleep(SystemClock.java:122)
  at com.sky.myjavatest.ANRTestActivity.onCreate(ANRTestActivity.java:20) ----> 產生ANR的包名以及具體行數
  at android.app.Activity.performCreate(Activity.java:6975)
  at android.app.Instrumentation.callActivityOnCreate(Instrumentation.java:1213)
  at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:2770)
  at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:2892)
  at android.app.ActivityThread.-wrap11(ActivityThread.java:-1)
  at android.app.ActivityThread$H.handleMessage(ActivityThread.java:1593)
  at android.os.Handler.dispatchMessage(Handler.java:105)
  at android.os.Looper.loop(Looper.java:164)
  at android.app.ActivityThread.main(ActivityThread.java:6541)
  at java.lang.reflect.Method.invoke(Native method)
  at com.android.internal.os.Zygote$MethodAndArgsCaller.run(Zygote.java:240)
  at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:767)

在文件中使用 ctrl + F 查找包名可以快速定位相關代碼。
通過上方log可以看出相關問題:

  • 進程id和包名:pid 23346 com.sky.myjavatest
  • 造成ANR的原因:Sleeping
  • 造成ANR的具體行數:ANRTestActivity.java:20類的第20行

特別注意:產生新的ANR,原來的 traces.txt 文件會被覆蓋。

2.4 ANR分析辦法三:Java線程調用分析

通過JDK提供的命令可以幫助分析和調試Java應用,命令為:

jstack {pid}

其中pid可以通過jps命令獲得,jps命令會列出當前系統中運行的所有Java虛擬機進程,比如

7266 Test
7267 Jps

具體分析參考:Android應用ANR分析 四.1節

2.5 ANR分析辦法四:DDMS分析ANR問題

  • 使用DDMS——Update Threads工具
  • 閱讀Update Threads的輸出

具體分析參考:Android應用ANR分析 四.2節

三、造成ANR的原因及解決辦法

上面例子只是由于簡單的主線程耗時操作造成的ANR,造成ANR的原因還有很多:

  • 主線程阻塞或主線程數據讀取

解決辦法:避免死鎖的出現,使用子線程來處理耗時操作或阻塞任務。盡量避免在主線程query provider、不要濫用SharePreferenceS

  • CPU滿負荷,I/O阻塞

解決辦法:文件讀寫或數據庫操作放在子線程異步操作。

  • 內存不足

解決辦法:AndroidManifest.xml文件<applicatiion>中可以設置 android:largeHeap="true",以此增大App使用內存。不過不建議使用此法,從根本上防止內存泄漏,優化內存使用才是正道。

  • 各大組件ANR

各大組件生命周期中也應避免耗時操作,注意BroadcastReciever的onRecieve()、后臺Service和ContentProvider也不要執行太長時間的任務。

四、ANR源碼分析

特別聲明:文章 理解Android ANR的觸發原理 分別記錄了由ServiceBroadcastReceiverContentProvider造成的ANR。下文引用該文代碼,并依據自己的簡單理解作總結。

4.1 Service造成的Service Timeout

Service Timeout是位于"ActivityManager"線程中的AMS.MainHandler收到SERVICE_TIMEOUT_MSG消息時觸發。

4.1.1 發送延時消息

Service進程attach到system_server進程的過程中會調用realStartServiceLocked,緊接著mAm.mHandler.sendMessageAtTime()來發送一個延時消息,延時的時常是定義好的,如前臺Service的20秒。ActivityManager線程中的AMS.MainHandler收到SERVICE_TIMEOUT_MSG消息時會觸發。

AS.realStartServiceLocked

ActiveServices.java

private final void realStartServiceLocked(ServiceRecord r,
        ProcessRecord app, boolean execInFg) throws RemoteException {
    ...
    //發送delay消息(SERVICE_TIMEOUT_MSG)
    bumpServiceExecutingLocked(r, execInFg, "create");
    try {
        ...
        //最終執行服務的onCreate()方法
        app.thread.scheduleCreateService(r, r.serviceInfo,
                mAm.compatibilityInfoForPackageLocked(r.serviceInfo.applicationInfo),
                app.repProcState);
    } catch (DeadObjectException e) {
        mAm.appDiedLocked(app);
        throw e;
    } finally {
        ...
    }
}

AS.bumpServiceExecutingLocked

private final void bumpServiceExecutingLocked(ServiceRecord r, boolean fg, String why) {
    ... 
    scheduleServiceTimeoutLocked(r.app);
}

void scheduleServiceTimeoutLocked(ProcessRecord proc) {
    if (proc.executingServices.size() == 0 || proc.thread == null) {
        return;
    }
    long now = SystemClock.uptimeMillis();
    Message msg = mAm.mHandler.obtainMessage(
            ActivityManagerService.SERVICE_TIMEOUT_MSG);
    msg.obj = proc;

    //當超時后仍沒有remove該SERVICE_TIMEOUT_MSG消息,則執行service Timeout流程
    mAm.mHandler.sendMessageAtTime(msg,
        proc.execServicesFg ? (now+SERVICE_TIMEOUT) : (now+ SERVICE_BACKGROUND_TIMEOUT));
}

4.1.2 進入目標進程的主線程創建Service

經過Binder等層層調用進入目標進程的主線程 handleCreateService(CreateServiceData data)

ActivityThread.java

   private void handleCreateService(CreateServiceData data) {
        ...
        java.lang.ClassLoader cl = packageInfo.getClassLoader();
        Service service = (Service) cl.loadClass(data.info.name).newInstance();
        ...

        try {
            //創建ContextImpl對象
            ContextImpl context = ContextImpl.createAppContext(this, packageInfo);
            context.setOuterContext(service);
            //創建Application對象
            Application app = packageInfo.makeApplication(false, mInstrumentation);
            service.attach(context, this, data.info.name, data.token, app,
                    ActivityManagerNative.getDefault());
            //調用服務onCreate()方法 
            service.onCreate();

            //取消AMS.MainHandler的延時消息
            ActivityManagerNative.getDefault().serviceDoneExecuting(
                    data.token, SERVICE_DONE_EXECUTING_ANON, 0, 0);
        } catch (Exception e) {
            ...
        }
    }

這個方法中會創建目標服務對象,以及回調常用的ServiceonCreate()方法,緊接著通過serviceDoneExecuting()回到system_server執行取消AMS.MainHandler的延時消息。

4.1.3 回到system_server執行取消AMS.MainHandler的延時消息

AS.serviceDoneExecutingLocked

private void serviceDoneExecutingLocked(ServiceRecord r, boolean inDestroying,
            boolean finishing) {
    ...
    if (r.executeNesting <= 0) {
        if (r.app != null) {
            r.app.execServicesFg = false;
            r.app.executingServices.remove(r);
            if (r.app.executingServices.size() == 0) {
                //當前服務所在進程中沒有正在執行的service
                mAm.mHandler.removeMessages(ActivityManagerService.SERVICE_TIMEOUT_MSG, r.app);
        ...
    }
    ...
}

此方法中Service邏輯處理完成則移除之前延時的消息SERVICE_TIMEOUT_MSG。如果沒有執行完畢不調用這個方法,則超時后會發出SERVICE_TIMEOUT_MSG來告知ANR發生。

4.2 BroadcastReceiver造成的BroadcastQueue Timeout

BroadcastReceiver Timeout是位于"ActivityManager"線程中的BroadcastQueue.BroadcastHandler收到BROADCAST_TIMEOUT_MSG消息時觸發。

4.2.1 處理廣播函數 processNextBroadcast() 中 broadcastTimeoutLocked(false) 發送延時消息

廣播處理順序為先處理并行廣播,再處理當前有序廣播。

final void processNextBroadcast(boolean fromMsg) {
    synchronized(mService) {
        ...
        // 處理當前有序廣播
        do {
            r = mOrderedBroadcasts.get(0);
            //獲取所有該廣播所有的接收者
            int numReceivers = (r.receivers != null) ? r.receivers.size() : 0;
            if (mService.mProcessesReady && r.dispatchTime > 0) {
                long now = SystemClock.uptimeMillis();
                if ((numReceivers > 0) &&
                        (now > r.dispatchTime + (2*mTimeoutPeriod*numReceivers))) {
                    //step 1\. 發送延時消息,這個函數處理了很多事情,比如廣播處理超時結束廣播
                    broadcastTimeoutLocked(false);
                    ...
                }
            }
            if (r.receivers == null || r.nextReceiver >= numReceivers
                    || r.resultAbort || forceReceive) {
                if (r.resultTo != null) {
                    //2\. 處理廣播消息消息
                    performReceiveLocked(r.callerApp, r.resultTo,
                        new Intent(r.intent), r.resultCode,
                        r.resultData, r.resultExtras, false, false, r.userId);
                    r.resultTo = null;
                }
                //3\. 取消廣播超時ANR消息
                cancelBroadcastTimeoutLocked();
            }
        } while (r == null);
        ...

        // 獲取下條有序廣播
        r.receiverTime = SystemClock.uptimeMillis();
        if (!mPendingBroadcastTimeoutMessage) {
            long timeoutTime = r.receiverTime + mTimeoutPeriod;
            //設置廣播超時
            setBroadcastTimeoutLocked(timeoutTime);
        }
        ...
    }
}

上文的step 1. broadcastTimeoutLocked(false)函數:記錄時間信息并調用函數設置發送延時消息

final void broadcastTimeoutLocked(boolean fromMsg) {
    ...
        long now = SystemClock.uptimeMillis();
        if (fromMsg) {
            if (mService.mDidDexOpt) {
                // Delay timeouts until dexopt finishes.
                mService.mDidDexOpt = false;
                long timeoutTime = SystemClock.uptimeMillis() + mTimeoutPeriod;
                setBroadcastTimeoutLocked(timeoutTime);
                return;
            }
            if (!mService.mProcessesReady) {
                return;
            }

            long timeoutTime = r.receiverTime + mTimeoutPeriod;
            if (timeoutTime > now) {
                // step 2
                setBroadcastTimeoutLocked(timeoutTime);
                return;
            }
        }

上文的step 2.setBroadcastTimeoutLocked函數: 設置廣播超時具體操作,同樣是發送延時消息

final void setBroadcastTimeoutLocked(long timeoutTime) {
    if (! mPendingBroadcastTimeoutMessage) {
        Message msg = mHandler.obtainMessage(BROADCAST_TIMEOUT_MSG, this);
        mHandler.sendMessageAtTime(msg, timeoutTime);
        mPendingBroadcastTimeoutMessage = true;
    }
}

4.2.2 setBroadcastTimeoutLocked(long timeoutTime)函數的參數timeoutTime是當前時間加上設定好的超時時間。

也就是上文的

long timeoutTime = SystemClock.uptimeMillis() + mTimeoutPeriod;

mTimeoutPeriod 也就是前臺隊列的10s和后臺隊列的60s。

public ActivityManagerService(Context systemContext) {
    ...
    static final int BROADCAST_FG_TIMEOUT = 10 * 1000;
    static final int BROADCAST_BG_TIMEOUT = 60 * 1000;
    ...
    mFgBroadcastQueue = new BroadcastQueue(this, mHandler,
            "foreground", BROADCAST_FG_TIMEOUT, false);
    mBgBroadcastQueue = new BroadcastQueue(this, mHandler,
            "background", BROADCAST_BG_TIMEOUT, true);
    ...
}

4.2.3 在processNextBroadcast()過程,執行完performReceiveLocked后調用cancelBroadcastTimeoutLocked

cancelBroadcastTimeoutLocked :處理廣播消息函數 processNextBroadcast() 中 performReceiveLocked() 處理廣播消息完畢則調用 cancelBroadcastTimeoutLocked() 取消超時消息。

final void cancelBroadcastTimeoutLocked() {
    if (mPendingBroadcastTimeoutMessage) {
        mHandler.removeMessages(BROADCAST_TIMEOUT_MSG, this);
        mPendingBroadcastTimeoutMessage = false;
    }
}

4.3 ContentProvider的ContentProvider Timeout

ContentProvider Timeout是位于”ActivityManager”線程中的AMS.MainHandler收到CONTENT_PROVIDER_PUBLISH_TIMEOUT_MSG消息時觸發。
參考理解Android ANR的觸發原理第四節

五、Android ANR的信息收集

無論是四大組件或者進程等只要發生ANR,最終都會調用AMS.appNotResponding()方法。
參考:理解Android ANR的信息收集過程

參考資料:

理解Android ANR的觸發原理
理解Android ANR的信息收集過程
Android App優化之ANR詳解
Android 源碼分析ANR

作者:Marker_Sky
鏈接:http://www.lxweimin.com/p/388166988cef
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,882評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,208評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,746評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,666評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,477評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,960評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,047評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,200評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,726評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,617評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,807評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,327評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,049評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,425評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,674評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,432評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,769評論 2 372

推薦閱讀更多精彩內容