安卓App穩(wěn)定性之旅

安卓App穩(wěn)定性之旅--記Crash率 <=0.1% 實踐

穩(wěn)定性的意義

在移動應用性能方面,崩潰帶來的影響是最為嚴重的。

移動應用崩潰主要是由操作系統(tǒng)引發(fā),是指應用在運行過程中出現(xiàn)的強制關(guān)閉(Force Closing)現(xiàn)象,從而打斷用戶正在進行的操作體驗。

應用崩潰可以造成關(guān)鍵業(yè)務中斷、用戶留存率下降、品牌口碑變差、生命周期價值下降等影響。

根據(jù)統(tǒng)計數(shù)據(jù)顯示,當iOS的崩潰率超過0.8%,Android的崩潰率超過0.4%的時候,活躍用戶有明顯下降態(tài)勢。

行業(yè)標準

image

Android行業(yè)標準:

  • 優(yōu)秀App:0%-0.2%
  • 標準App:0.2%-0.4%

而作為一個有追求的技術(shù)團隊,我們追求一個有挑戰(zhàn)的標準:Crash Session<=0.1% 或者說Crash Free Session>=99.9%

:)

改進前

image

分析:

  • Crash平均在0.3%
  • 偶爾觸達0.2%
  • 某時間段一度高于0.8%(不穩(wěn)定)
  • 從未達到過0.1%

評價:處于行業(yè)標準水平,偶爾有隱患版本發(fā)布

三板斧

  1. 磨刀不誤砍柴工:改進Crash上報系統(tǒng)

    每個app都有Crash上報系統(tǒng),手機證券采用的是百度SDK。而它不能將線上混淆后的代碼映射成開發(fā)代碼,因此很難定位問題。

    因此我們將百度SDK替換成Fabric。

    百度SDK:

    image

    Fabric:

    image
  2. 第一板斧:解決Crash問題

    現(xiàn)在的當務之急當然是解決已有Crash問題了。

    image
  3. 第二板斧:提高編碼質(zhì)量

    高質(zhì)量代碼是穩(wěn)定性的基石,在當前背景下(較多需求開發(fā)),我們有沒有工具能高效地幫助我們提高代碼質(zhì)量呢?,能有立竿見影效果呢?

    靜態(tài)掃描工具:Lint、Findbugs

    • Lint:安卓自帶的代碼掃描工具

      通過它對Android工程源代碼進行掃描和檢查,可發(fā)現(xiàn)潛在的問題。

      主要包括:xml文件中是否存在hardcode、unused resources、probable bug等等。

    • Findbugs是java的靜態(tài)分析工具

      它檢查類或者JAR 文件,將字節(jié)碼與一組缺陷模式進行對比以發(fā)現(xiàn)可能的問題。

      Findbugs自帶檢測器,其中有60余種Bad practice,80余種Correctness,1種 Internationalization,12種Malicious code vulnerability,27種Multithreaded correctness,23種Performance,43種Dodgy。

    通過這兩個工具的掃描報告,可以找到很多代碼的邏輯錯誤、隱藏問題、性能問題等一般共性問題。

    同時我們也要認識到這類工具的局限性。并通過自定義配置來避免“噪音”。

    lint:

    image
    image

    findbugs:

    image
    image
  4. 第三板斧:灰度

    測試遺漏問題就這樣放出去嗎?有隱藏bug怎么辦?

    祭出王牌:灰度發(fā)布

    所謂的灰度發(fā)布,簡單來講,就是不要一開始就讓所有用戶下載安裝應用,而是先覆蓋一小部分用戶!

    發(fā)布不是簡單的從0到1,不是非黑即白,在中間有一個緩沖的灰色地帶

    通過灰度發(fā)布,真實用戶的真實場景測試,我們可以更全面、更深入的收集問題,修復問題。
    隨著灰度覆蓋范圍的增加,暴露的問題也越來越充分,而當全量發(fā)布的時候,一定是一個穩(wěn)定的版本!

    目前的策略:先在某一個渠道灰度,當問題暴露的足夠多時,再發(fā)布全量版本。

改進后

image

Never Stop

目標:長期穩(wěn)定在<=0.1%

后續(xù)規(guī)劃的實踐

  1. 編程維度:

    • 持續(xù)解決收集到的Crash問題

    • OOM和內(nèi)存泄漏問題:

      • 通過LeakCancary來檢測內(nèi)存泄漏問題,并解決問題。
      • 通過內(nèi)存檢測工具來檢測內(nèi)存占用情況,并優(yōu)化問題。
      • 通過技術(shù)選型,尋找更好的圖片管理框架。
    • 編碼規(guī)范:編碼規(guī)范的重要性我就不闡述了

      1. 統(tǒng)一團隊內(nèi)編碼規(guī)范,這里可以參考:阿里巴巴的Java開發(fā)手冊,站在巨人的肩膀上。
      2. 生成編碼規(guī)范的IDE(Android Studio)配置,工程師導入配置之后,可以非常方便的用快捷鍵 Reformate Code
      3. 使用靜態(tài)掃描工具CheckStyle和Lint來檢查代碼規(guī)范。
    • 代碼重復度:

      1. 通過靜態(tài)掃描工具檢測重復代碼。
      2. 抽取重復代碼,提供工具類及底層基礎類。
    • 復雜度:

      • 框架升級:一個好的框架可以減少工程師的代碼量,提高效率。
      • Kotlin:語言級的改進。簡潔的語法,以及NullSafty特性都是非常好的特性。
  2. 流程化及工具維度:

    • 結(jié)對編程:主要是在前期設計和疑難模塊編寫時使用,希望取長補短,尋求更高質(zhì)量的代碼。
    • CodeReview:在代碼提交的流程上使用CodeReview機制。
    • 在Jenkins中集成靜態(tài)掃描插件:findbug、lint、CheckStyle、PMD等。
  3. 測試維度:

    • 充分的開發(fā)自測:自己寫的代碼,自己最清楚會有什么問題,開發(fā)自測發(fā)現(xiàn)問題的效率最高。
    • 單元測試:
      • 引入單元測試框架:junit、mockito、robolectric
      • 靜態(tài)掃描工具:單元測試覆蓋率
    • 兼容性測試
    • monkey測試
  4. 發(fā)布維度:

    • 灰度2.0

      當前灰度策略其實還不完善,后續(xù)我們會提供一種更完善的灰度機制:根據(jù)用戶的應用版本號,手機型號,UUID等信息來選擇灰度的用戶,通過彈對話框的方式提示用戶升級。

      這樣我們就能很方便的從多個維度來灰度,比如:Android7.0里面5%的用戶。

    • 終極殺招:熱修復

      通過熱修復技術(shù),客戶端可以發(fā)布補丁來解決線上版本的穩(wěn)定性問題,而無需發(fā)版本。

      熱修復作為當下熱門的技術(shù),在業(yè)界內(nèi)比較著名的有阿里巴巴的AndFix、Dexposed,騰訊QQ空間的超級補丁和微信的Tinker。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容