聲明:原創文章,轉載請注明出處http://www.lxweimin.com/p/8a296b75d95f
APP卡頓對用戶體驗有很大的影響,今天就來總結下Android應用卡頓相關內容。
要想知道應用卡頓是怎么產生的,我們首先得了解下手機屏幕的畫面是怎么產生的,也就是Android的屏幕刷新機制。
Android 屏幕刷新機制
一級緩存
如上圖所示,當需要顯示一幀畫面時,CPU會先計算相關數據,然后再通過GPU渲染,GPU渲染完之后會把這幀畫面存入一個緩存中,CPU和GPU向緩存中存入畫面的速率也叫幀率,幀率是變化的,比如APP中一個列表,當列表靜止不動幀率就是0,如果滑動起來幀率就會變化。接著我們的屏幕會以一定的頻率來從緩存中取數據,這個速率也叫做屏幕刷新率。這個刷新率是固定的,一般為60hz,當然現在也有90hz甚至120hz的屏幕。另外屏幕從緩存中取數據也不是瞬間取完的,它是有一個掃描的過程,也就是一個像素點一個像素點的去緩存中去取,取的順序是逐行地從左到右逐個像素點掃描。不過這也帶來了一個問題,就是可能會在屏幕取數據取到一半的時候,這時緩存中數據更新了,但是屏幕并不知道,會接著從緩存中取,當然接下來取到的數據其實的更新后的新的一幀,這樣屏幕就同時顯示了兩幀畫面,我們叫這種現象為畫面撕裂
,如下圖所示:
二級緩存
為了解決這個問題,可以增加一個緩存,如下:
可以看到上面有兩個緩存,Back Buffer和Frame Buffer,每次CPU、GPU產生的幀數據都存入Back Buffer,而屏幕每次都是從Frame Buffer中取,然后需要更新畫面的時候,就交換Back Buffer和Frame Buffer兩個緩存中的數據。那么這個交換兩個緩存的時間如何確定呢,我們知道屏幕顯示一幀是逐個像素點顯示,是需要時間,而取完一幀的最后一個點到顯示下幀第一個,這個時間段正好可以作為切換這兩個緩存的時間點,此時會發出 VSync 信號,即垂直同步信號。但是CPU和GPU計算畫面的時間點不是確定的,也就是畫面的產生和刷新是不同步的,這樣就會有一個問題
上圖我們可以看到,第一幀在垂直同步信號到來之前已經計算好了,所以當垂直同步信號到來的時候成功顯示,但是當第二個垂直同步信號來的時候第二幀的畫面還沒計算完,所以會再次顯示第一幀,也就出現卡頓,我們也叫這種為掉幀,顯然掉幀不是少了一幀而是多了一幀。有啥辦法可以解決?上圖可以看到第二幀的計算是在第一個VSync和第二個VSync中間才開始計算的,那么能不能在第一個VSync來了之后立馬開始計算為第二幀的顯示做準備,這樣就有足夠的時間來準備這幀畫面。答案是肯定的,從Android 4.1開始Google對這一問題進行了優化,就是每當同步信號過來的時候就開始為下一幀做準備,如下圖:
但是有的時候我們一幀的計算非常耗時,時間超出了兩個VSync的間隔,如下:
可以看到GPU在渲染B幀的時候太耗時了,再下次VSync到來的時候還沒渲染好,這時就會重復顯示上幀的內容即畫面A,這樣就又出現卡頓,直到下個Vsync信號到來才會顯示B幀。
三級緩存
上面我們可以看到,當一個VSync到來的時候,GPU還在計算,但是CPU其實已經計算完了,那么為什么這時CPU不參加計算下一幀的畫面呢?這樣就可以節省很多時間。原因是CPU和GPU是公用的一個緩存,也就是上面提到的Back Buffer,所以為了解決這個問題,Android 又為CPU增加了一個獨立的緩存。
上面可以看到第一個垂直同步信號到來的時候,GPU還在計算畫面,但是CPU已經空閑了,所以已經開始計算下一幀了,這樣就提高了時間利用率。
卡頓產生的原因
了解了Android屏幕的刷新機制,來總結下卡頓產生的原因,從上面我們也能知道,卡頓的本質就是一幀的展示時間大于了兩個垂直同步信號的時間間隔。下面簡單概括下一幀的畫面是為啥變慢的,先從系統層面來看下,有以下幾個原因:
SrufaceFlinger主線程耗時
后臺活動進程太多導致系統繁忙
主線程調度不到,處于Runnable狀態
System鎖
Layer過多導致SurfaceFlinger Layer Compute耗時
從應用層角度有以幾個原因:
主線程執行時間長
主線程Binder耗時
Webview性能不足
幀率與刷新率不匹配
卡頓檢測
往往造成卡頓的代碼是很隱蔽的,所以對卡頓代碼的檢測和定位就顯得尤為重要。當然對卡頓的檢測需要借助一些分析工具,下面簡單羅列了幾種分析工具:
使用dumpsys gfxinfo
使用Perfetto
使用LayoutInspector檢測布局層次
使用BlockCanary
dumpsys gfxinfo
這是一個adb命令,可以大致顯示當前應用的一些顯示數據,命令如下:
adb shell dumpsys gfxinfo 應用完整包名
部分顯示內容如下
Stats since: 2136261710504255ns
Total frames rendered: 1 // 本次搜集了一幀的信息
Janky frames: 1 (100.00%) // 卡頓的幀數為1,占比100%
50th percentile: 34ms
90th percentile: 34ms
95th percentile: 34ms
99th percentile: 34ms
Number Missed Vsync: 0 // 垂直同步失敗的幀
Number High input latency: 0 // 處理input超時的幀
Number Slow UI thread: 0 //因UI線程超時導致卡頓的幀
Number Slow bitmap uploads: 0 // 因bitmap的加載耗時的幀數
Number Slow issue draw commands: 1 // 因繪制導致耗時的幀數
Number Frame deadline missed: 1
perffeto
perffeto是一個網頁版的性能分析工具,地址是https://ui.perfetto.dev/#!/,分析時需要上傳性能跟蹤文件,當然這個文件可以通過Android手機自帶的一個系統應用追蹤錄制生成。打開這個系統應用的方式是開發者模式->調試->系統跟蹤
,然后打開跟蹤可調式的應用
開關,這樣你手機的上方快捷操作欄就會多出一個錄制跟蹤記錄
的快捷開關,點擊后就會進行性能追蹤錄制,再次點擊就會停止錄制,并且會在通知欄中產生一個完成錄制的提示,點擊就可以分享錄制的跟蹤文件。
接下來簡單演示下,創建一個默認空項目,然后在MainActivity中的onResume
方法中加入3秒的sleep,如下:
override fun onResume() {
super.onResume()
Thread.sleep(3000)
}
接下來我們點擊快捷欄的錄制按鈕,然后在手機上運行該demo,大概過個10秒左右點擊停止錄制,然后生成跟蹤文件,我們把這個跟蹤上傳至上面的perffeto分析地址,然后會得到這樣的分析結果:
可以看到上面這些五顏六色的可以理解成一個個事件,橫坐標是時間,方塊長度越長說明越耗時,接下來我們找到我們剛剛寫的demo
可以看到我們這個demo中,有一個明顯很長的事件,上面也可以看到事件的名字就是我們剛才寫的onResume,可以看上面的時間軸剛好也是3秒,這樣我們也就定位出問題所在了。
LayoutInspector
布局如果嵌套太多也會影響畫面的渲染產生卡頓,所以可以借助LayoutInspector工具來查看布局的層級結構,這個是Android Studio內置的
如上圖所示,左側會顯示該布局的層級結構。
BlockCanary
BlockCanary是一個非侵入式的三方庫,它是模仿的LeakCanary。當某處有延遲時,就會在通知欄提示。他的原理是基于handler機制,對handler還不是很了解的可以參考之前的這篇文章Android 帶你徹底理解跨線程通信之Handler機制,我們知道Android主線程中所有的事件都是通過handler處理的,而系統在handler每次處理消息的前后都預留了日志輸出的接口,那么我們可以在預留的接口中增加時間記錄,然后計算事件處理前后的時間差,如果大于某一閾值就產生告警提示開發者,這也就是BlockCanary的思路。
卡頓優化
在上面我們已經了解了卡頓產生的原因就是一幀的渲染大于規定的時間,那么優化的主要思路就是減少耗時,當然上面我們也說了一些耗時的代碼往往是很隱蔽的,這就需要我們使用上面提到的卡頓檢測和定位的工具,這也是卡頓優化的關鍵。此外我們還是簡單羅列下優化的一些方向:
布局優化:布局的過多嵌套會影響渲染效率
減少主線程耗時:這個不多說了
減少過渡繪制:界面的過渡繪制也會影響耗時
列表優化 :比如某一個item更新,只需要更新這個item不需要整個列表全部更新
對象分配和回收優化:因為Java垃圾回收會暫停線程,所以要避免頻繁的創建對象銷毀對象,減小垃圾回收頻次。