▣ アプリ開発/2026-07-03上級

クラッシュ一覧には一度も現れない不調 — ANR トレースを ApplicationExitInfo で回収し、エージェントに切り分けを渡す設計

クラッシュハンドラに映らない ANR を ApplicationExitInfo で起動時に回収し、トレースの切り分けを Antigravity のエージェントへ安全に渡すまでの実装と5週間の実測値です。

Antigravity³⁰⁵ Android²⁴ ANR ApplicationExitInfo Play Console

✦ プレミアム記事

昨年の暮れ、個人開発で運営している壁紙アプリの Play Console を開いたときのことです。クラッシュ率は 0.1% を切っていて、クラッシュ一覧は何週間も静かなまま。それなのに「ユーザーが感知した ANR 発生率」だけが 0.62% まで上がり、不良動作のしきい値である 0.47% を超えていました。

クラッシュは一件も増えていないのに、品質指標だけが沈んでいく。この非対称に気づくまで、私はずいぶん遠回りをしました。ANR はクラッシュとは別の経路で起きて、別の経路でしか観測できないためです。

本稿は、その ANR を ApplicationExitInfo で自前回収する実装と、回収したトレースの切り分けを Antigravity のエージェントに渡すときの制約設計、導入から5週間の実測値の記録です。

なぜクラッシュハンドラに ANR が映らないのか

自前のクラッシュ計測の多くは Thread.setDefaultUncaughtExceptionHandler を土台にしています。JVM 例外が投げられれば捕まえられる仕組みです。

ANR はここを通りません。メインスレッドが応答しなくなったとき、例外はプロセス内に投げられず、システム側が「このプロセスは応答していない」と判定して外からダイアログを出し、多くの場合そのままプロセスを終了させます。アプリ側のハンドラが呼ばれる瞬間が存在しないのです。

事象	UncaughtExceptionHandler	ApplicationExitInfo (API 30+)
JVM クラッシュ	捕捉できる	REASON_CRASH として記録
ネイティブクラッシュ	捕捉できない	REASON_CRASH_NATIVE として記録
ANR	捕捉できない	REASON_ANR としてトレース付きで記録
OOM キル・ユーザー強制終了	捕捉できない	REASON_LOW_MEMORY / REASON_USER_REQUESTED

公平のために書き添えると、Firebase Crashlytics も API 30 以降は同じ ApplicationExitInfo を経由して ANR を報告してくれます。ダッシュボードで発生率を眺めるだけならそれで足ります。

私が自前回収に踏み込んだ理由は一つで、トレース全文をテキストとして自分のパイプラインに乗せたかったからです。集計画面で丸められたスタックを目視するのではなく、生のトレースをそのままエージェントの入力に渡す。後半で述べる切り分けの自動化は、ここが起点になります。

起動時に前回の ANR を回収する実装

ApplicationExitInfo は「前回までのプロセス終了理由」を後から照会する API です。ANR が起きたその瞬間には何もできませんが、次の起動時に理由とトレースを取り出せます。

何を解決するコードか: アプリ起動時に前回プロセスの終了履歴を照会し、ANR だけをローカルに保存するコレクターです。

class ExitInfoCollector(private val context: Context) {
 
    private val prefs =
        context.getSharedPreferences("exit_info_collector", Context.MODE_PRIVATE)
 
    // Application.onCreate から Dispatchers.IO で呼ぶこと。
    // メインスレッドで readText すると、それ自体が新しい ANR の種になります。
    fun collect() {
        if (Build.VERSION.SDK_INT < Build.VERSION_CODES.R) return
 
        val am = context.getSystemService(ActivityManager::class.java)
        val lastSeen = prefs.getLong("last_timestamp", 0L)
 
        val reports = am.getHistoricalProcessExitReasons(context.packageName, 0, 16)
 
        reports
            .filter { it.timestamp > lastSeen }
            .filter { it.reason == ApplicationExitInfo.REASON_ANR }
            .forEach { info ->
                val trace = runCatching {
                    info.traceInputStream?.bufferedReader()?.use { r -> r.readText() }
                }.getOrNull()
 
                saveReport(
                    timestamp = info.timestamp,
                    description = info.description ?: "no description",
                    trace = trace
                )
            }
 
        // ANR 以外も含めた最新の timestamp を控えておき、次回の二重処理を防ぐ
        reports.maxByOrNull { it.timestamp }?.let {
            prefs.edit().putLong("last_timestamp", it.timestamp).apply()
        }
    }
 
    private fun saveReport(timestamp: Long, description: String, trace: String?) {
        val dir = File(context.filesDir, "anr_reports").apply { mkdirs() }
        val body = buildString {
            appendLine("timestamp: $timestamp")
            appendLine("description: $description")
            appendLine("---")
            append(trace ?: "trace unavailable")
        }
        File(dir, "anr_$timestamp.txt").writeText(body)
    }
}

なぜこう書くのか。押さえどころは三つあります。

トレースは null のことがあります。 traceInputStream が値を返すのは REASON_ANR と REASON_CRASH_NATIVE のときだけで、しかも端末やタイミングによっては ANR でも取れないことがあります。私のアプリでは取得成功率が84%前後でした。null でも description だけは必ず残す設計にしておくと、発生した事実までは失わずに済みます。

タイムスタンプで重複排除をします。 getHistoricalProcessExitReasons は履歴をそのまま返すので、何もしなければ毎回同じレポートを処理してしまいます。前回処理した最新の timestamp を控えておく、それだけの地味な一手間です。

回収処理そのものをメインスレッドに置かないこと。 トレースは数百 KB になることがあります。起動直後の Application.onCreate で同期的に読むと、ANR を観測するためのコードが ANR を作るという皮肉な循環になります。

✦

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること

✦起動時に前回の ANR トレースを回収する ApplicationExitInfo の実装（タイムスタンプ重複排除・トレース欠損時のフォールバック込み）

✦AI 生成コードに潜みやすい ANR の3類型と、メインスレッドから処理を逃がす Before/After の修正コード

✦トレースをエージェントに渡す際の制約設計（逐語引用の強制・候補3件上限・修正は人間レビュー）と導入5週間の実測値

Stripe による安全な決済 · いつでもキャンセル可能

✦

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または

メンバーシップなら全記事が読み放題 →

AI が生成したコードに潜みやすい ANR の三つの型

回収を始めて最初の2週間で、うちのアプリの ANR は三つの型に収束しました。いずれも、エージェントに実装を任せた画面で「動くけれどスレッドの置き場所が甘い」コードです。生成コードはコンパイルが通り、手元の高速な端末では何事もなく動いてしまうため、レビューをすり抜けやすいのです。

類型	トレースでの見え方	典型的な発生画面
原寸画像のメインスレッドデコード	main が BitmapFactory.decodeFile / decodeStream の中	壁紙適用・共有画像の生成
BroadcastReceiver 内の同期処理	main が onReceive の中で I/O 待ち	日付変更・接続状態変化のレシーバ
SharedPreferences の commit 連打	main が QueuedWork.waitToFinish で待機	設定画面・お気に入りの一括操作

一つ目の型を例に、Before/After を示します。

うまくいかない例です。4K クラスの壁紙画像では、この1行のデコードだけで低速な端末では数秒かかります。

// Before: 壁紙適用の直前、メインスレッドで原寸ビットマップをデコードしていた
fun applyWallpaper(file: File) {
    val bitmap = BitmapFactory.decodeFile(file.absolutePath)
    WallpaperManager.getInstance(context).setBitmap(bitmap)
}

修正後は、デコードと適用を丸ごと IO ディスパッチャへ逃がし、表示密度に合わせた縮小サンプリングを挟みます。

// After: デコードも適用も IO へ。画面サイズ以上の解像度は inSampleSize で落とす
suspend fun applyWallpaper(file: File, targetWidth: Int) =
    withContext(Dispatchers.IO) {
        val opts = BitmapFactory.Options().apply { inJustDecodeBounds = true }
        BitmapFactory.decodeFile(file.absolutePath, opts)
 
        val sample = generateSequence(1) { it * 2 }
            .first { opts.outWidth / (it * 2) < targetWidth }
 
        val bitmap = BitmapFactory.decodeFile(
            file.absolutePath,
            BitmapFactory.Options().apply { inSampleSize = sample }
        )
        WallpaperManager.getInstance(context).setBitmap(bitmap)
    }

二つ目の型は締め切りが厳しく、フォアグラウンドのレシーバはおおむね10秒、入力イベントの応答は5秒で ANR と判定されます。onReceive の中で同期 I/O をしている生成コードを見つけたら、goAsync() で猶予を取るか WorkManager へ委譲するのが定石です。

三つ目の型は、commit() が fsync を伴う同期書き込みである点が原因です。apply() への置き換えで急場は凌げますが、ライフサイクル境界で QueuedWork の待ち合わせが発生するため、書き込みが多い画面なら DataStore への移行まで進めたほうが根本的です。

トレースの切り分けをエージェントに渡すときの制約

ここからが Antigravity の出番です。ANR トレースは長く、main 以外のスレッドが何十本も並びます。目視での切り分けは、正直なところ夜の作業には向きません。

ただし、そのまま全文を渡して「原因を直してください」と頼むのは避けています。過去に別件で、トレースに存在しないフレームを根拠に修正を提案された経験があるためです。現在は制約を三つに絞っています。

入力: anr_reports/ 配下の未処理トレース
 
制約:
1. 根拠にするフレームは、トレースから逐語で引用すること。
   引用できないフレームを根拠にした推測は出力しない。
2. 原因候補は最大3件。それぞれに「該当スレッド」「保持ロック」
   「対応するアプリ側ソースファイル」を添える。
3. コードの修正は行わない。切り分けレポートの出力のみ。
   修正は人間がレビューして別途行う。

渡す前の前処理として、main スレッドのスタックと、main が待っているロックを保持しているスレッドだけを抽出しています。これでトレースは平均で1/10ほどの長さになり、切り分けの精度も体感でかなり安定しました。「全部渡して全部考えてもらう」より、「見るべき場所を狭めて渡す」ほうが、エージェントの推論は素直になります。

修正までエージェントに任せない理由も書いておきます。ANR の修正はスレッド境界の変更を伴うことが多く、影響範囲がスタックの見た目より広いためです。切り分けは機械に、判断は人間に。この分担が、私自身にはいちばん安心できる置き方でした。

導入から5週間で何が変わったか

一つのアプリでの観測値なので、そのまま一般化はできませんが、等身大の数字を残しておきます。

指標	導入前	5週間後
ユーザーが感知した ANR 発生率	0.62%	0.21%
回収した ANR レポート	—	47件（トレース取得84%）
特定して修正した原因	—	3件（上記3類型が各1件）
1件あたりの切り分け時間	約40分（目視）	約10分（レポート確認＋裏取り）

しきい値の 0.47% を下回ってから、検索経由の表示の落ち込みも止まりました。因果を断定はできませんが、Play Console の品質指標が配信面に響くこと自体は公式に明言されています。指標の見方は Play Console の統計データを分析に活かす手順に、起動まわりの実測の詰め方は Baseline Profile でコールドスタートを実測しながら詰めた記録にまとめています。

次の一歩としては、まず ExitInfoCollector を仕込んで、1週間分のレポートを眺めてみてください。クラッシュ一覧が静かでも、そこには別の景色が写っているかもしれません。同じ指標とにらめっこしている方の参考になれば幸いです。