ANTIGRAVITY LABEN
記事一覧/Agents & Manager
Agents & Manager/2026-06-30上級

Android CLI が3倍速・トークン7割減になったとき、増やすべきは並列数ではなく1件あたりの検証だった

Android CLI のエージェントが3倍速・トークン約7割減になった、というニュースを見て最初に考えたのは「では何本同時に走らせようか」でした。けれど速くなって本当に変わるのは生産量ではなく、詰まる場所です。レビューと検証ゲートに移ったボトルネックを Little's Law で見積もり、WIP キャップで並列数を抑え、浮いた予算を1件あたりの検証に回す設計を、動く Python 実装と実測値でまとめました。

Antigravity294AIエージェント36本番運用16WIP制御信頼性設計7

プレミアム記事

Android CLI のエージェントが標準ツール比で約3倍速く、トークン使用量を約7割削減した、というニュースを見たとき、私自身が最初に頭に浮かべたのは「では同時に何本走らせようか」でした。速くなったぶん並列度を上げれば、こなせる仕事も増えるはずだ——個人開発で複数のアプリとサイトを回していると、つい数の話に引き寄せられます。

けれど少し手を動かしてみて、その直感は外れていました。エージェントが速くなって本当に変わるのは「生み出せる仕事の量」ではなく、「どこで詰まるか」です。モデルが律速だった頃は、増やせば増えた分だけ前に進みました。モデルが速くなった瞬間、列の先頭はレビューと検証ゲートに移ります。そこを見ないまま並列数だけ上げると、速くしたはずなのに、取り込める変更の数は変わらず、見落としだけが増えていきます。

ここでは、速さを並列数に変換してはいけない理由を待ち行列の言葉で整理し、並列数の上限を検証スループットから決め、それを admission controller として強制し、浮いたトークン予算を1件あたりの検証に再投資するまでを、実装と実測値で書いていきます。

3倍速・7割減で本当に変わるのは「どこが詰まるか」

エージェント開発の体感は、律速段階がどこにあるかで決まります。モデルの生成が遅かった時代は、待ち時間のほとんどがモデルでした。だから「速いモデル」「並列化」は素直に効きました。生成が3倍速くなれば、生成待ちは3分の1になります。

問題は、変更が本番に入るまでの工程が生成だけではないことです。エージェントが出した差分は、検証ゲート(型チェック・テスト・lint・eval)を通り、人間のレビューを経て、ようやくマージされます。生成が速くなっても、この後段が同じ速さで広がるわけではありません。型チェックとテストの実行時間は変わりませんし、人間がレビューに使える時間は1日でほぼ固定です。

つまり3倍速・7割減で起きるのは、工程全体の高速化ではなく、律速段階の移動です。先頭はモデルから「検証ゲート+レビュー」へ移ります。ここを見ずに並列数を上げると、生成済みだけれど検証もレビューも終わっていない変更が、列に積み上がっていきます。速くなったのは入口だけで、出口の幅は変わっていないからです。

速さを並列数に変換すると何が起きるか(Little's Law)

詰まりを感覚ではなく数で捉えるために、待ち行列のいちばん基本的な関係を使います。Little's Law です。

L = λ × W
  L … 系の中に同時に存在する仕事の数(ここでは「進行中の変更数」= WIP)
  λ … スループット(単位時間あたりに系を通り抜ける仕事の数)
  W … 1件が系に滞在する平均時間(リードタイム)

ここで系を「生成 → 検証 → レビュー → マージ」全体と見ると、λ(週あたりに本当にマージできる変更数)は後段の能力で決まります。生成をいくら速くしても、検証とレビューが捌ける λ は増えません。

それでも並列数(WIP=L)だけ増やすと、式の関係から W(リードタイム)が伸びるだけです。λ が一定で L が増えれば、W = L / λ は必ず大きくなります。これは「たくさん仕掛かっているのに、1件が出てくるまでがどんどん遅くなる」状態そのものです。私自身、エージェントを速いモデルに替えた直後に並列数を倍にして、まさにこれを再現してしまいました。生成は速いのに、ある変更がマージされるまでの日数はむしろ伸びていたのです。

結論はシンプルです。後段のスループット λ を上げない限り、WIP を増やしても delivered は増えない。 速さは、並列数ではなく別のところに使うべきだ、ということになります。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
Little's Law で「同時に進めてよい変更数 = レビュー+検証ゲートのスループット × 1件あたりの滞留時間」を見積もり、エージェントが3倍速になっても増やせる並列数の上限を数式で決められるようになります
速くなった分をそのまま並列数に回すと、週あたりの取り込み件数は頭打ちのままレビュー品質だけ落ちる——その構造を admission controller(WIPキャップ)の Python 実装で防ぎます
トークンが約7割減って浮いた予算を『1変更あたり2回目の自己検証・追加 eval』へ再投資する判断基準と、効果をどう測るか(delivered/週・すり抜け率)まで具体化します
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Antigravity Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Agents & Manager2026-06-03
やり直せる操作とやり直せない操作を分けて任せる — 可逆性で自律度を決めるエージェント設計
Antigravity のエージェントに本番作業を任せるとき、賢さより先に効いてくるのは「その操作をあとから取り消せるか」です。操作を可逆性で3階層に分け、自動実行・チェックポイント付き実行・人間ゲートへ振り分ける設計を、TypeScript の実装と6アプリ並行運用の実測値つきで整理しました。
Agents & Manager2026-06-01
途中で失敗したエージェントの副作用を巻き戻す — 補償トランザクション設計の実装メモ
Antigravity のエージェントに複数の外部システムをまたぐ作業を任せると、途中の一段が失敗したときに半分だけ世界が書き換わって残ります。やり直しでは直らないこの状態を、補償トランザクション(Saga)で安全に巻き戻す設計を、TypeScript の実装と実運用の数値つきで整理しました。
Agents & Manager2026-05-31
自律エージェントの流量を制御する — バックプレッシャーと待ち行列で本番を壊さない設計
Antigravity のエージェントを複数同時に走らせると、賢さより先に「下流が捌けない」問題にぶつかります。同時実行数・到着レート・処理能力の3つで流量を捉え、待ち行列・セマフォ・トークンバケット・バックプレッシャーで本番を守る設計を、TypeScript の実装と実測値つきで整理しました。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →