ANTIGRAVITY LABEN
記事一覧/Agents & Manager
Agents & Manager/2026-07-05上級

エージェント開発スタックの『既知の正常』を1枚のロックファイルで守る — 可動部が同時に動く時代の変更予算設計

IDEビルド・CLI・モデル・依存が同時に動くと、回帰の原因が特定できなくなります。既知の正常を1枚のロックファイルに固定し、一度に動かす軸を絞る変更予算の設計を、実装コードと運用ログで整理しました。

antigravity415agents86reproducibility2change-managementproduction59

プレミアム記事

7月1日、Antigravity は v2.2.1・v2.1.4・v2.0.11 を同じ日に公開しました。安定版と新機能版を並行して選べる体制です。同じ時期に、手元の CLI は Gemini CLI から Antigravity CLI へ移り、既定モデルも静かに更新されます。

私自身、個人開発で4つの技術ブログの記事生成を毎日エージェントに任せています。ある朝、生成された記事のテーブルが崩れて出力されました。原因を探ろうとして、手が止まりました。

前回の正常な実行から今日までに、動いていた部品が多すぎたのです。IDE のビルドが上がり、CLI が別実装に替わり、モデルが更新され、依存パッケージも2つ上がっていました。どれが崩したのか、切り分ける手がかりがありません。

この記事は、その朝の反省から組み直した「変更予算」の設計です。派手な自動化ではなく、可動部が増えた環境で回帰の原因を最短で見つけるための、地味な土台の話をします。

可動部が増えると「どれが壊したか」が分からなくなる

エージェント開発のスタックは、いつのまにか独立に動く軸の集合になっています。少なくとも次の4つは、それぞれ別のタイミングで更新されます。

可動軸更新の主体更新頻度の体感
Antigravity IDE ビルド公式リリース(安定版/新機能版が並行)週単位
Antigravity CLIツール統合・移行に伴う更新不定期・移行時に断続
既定モデルプラットフォーム側の差し替え予告なく静かに
依存パッケージ自分の npm update や自動更新随時

問題は、これらが組み合わせで効いてくることです。軸が4つあれば、状態の組み合わせは指数的に増えます。1週間に各軸が1回ずつ動いただけでも、前回の正常な実行との差は4軸ぶん開きます。

回帰が起きたとき、私たちは「何が変わったか」を再構成しようとします。ところが4軸ぶんの変化が同時に積まれていると、二分探索の起点そのものが失われます。原因の候補が多すぎて、勘に頼るしかなくなるのです。

無人実行では、これがさらに重くなります。夜間に走らせたパイプラインが崩れた出力を出しても、その瞬間の環境スナップショットが残っていなければ、翌朝には「今の環境」しか手元にありません。壊れた時点の状態は、もう再現できません。

「既知の正常」を1枚のロックファイルに固定する

最初にやるべきは、最後に正常だった実行の環境を、1枚のファイルに書き留めることです。アプリケーションの package-lock.json が依存を固定するのと同じ発想を、スタック全体へ広げます。

私は stack.known-good.yml という名前の1枚を、リポジトリ直下に置いています。

# stack.known-good.yml
# 「この組み合わせなら正常に走り切った」最後の状態を記録する
known_good:
  captured_at: "2026-07-01T09:00+09:00"
  note: "4サイトの記事生成が JA=EN 一致・テーブル崩れなしで完走"
  axes:
    antigravity_ide: "2.0.11"
    antigravity_cli: "0.4.2"
    default_model: "gemini-3.5-flash-2026-06"
    node: "22.14.0"
  deps:
    "@antigravity/sdk": "2.3.1"
    "yaml": "2.6.1"
# 変更予算: 前回の正常状態から同時に動かしてよい軸の最大数
change_budget: 1

要点は3つあります。

  1. 各軸の版を、人間が読める形で残すこと
  2. 正常を宣言する条件を note に書くこと
  3. 変更予算を、このファイルに同居させること

第一に、各軸の版を人間が読める形で残すこと。ハッシュだけでは、後から「どのモデルだったか」を思い出せません。日付と短いメモを添えます。

第二に、正常を宣言する条件を note に書くこと。何をもって「正常」とするかは運用ごとに違います。私の場合は「日英記事数が一致し、テーブルが崩れず完走した」ことです。この基準を言語化しておくと、次に更新するときの判断がぶれません。

第三に、変更予算をこのファイルに同居させること。予算は環境と一体で管理すると、レビュー時に一目で見えます。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
IDEビルド・CLI・モデル・依存の版を1枚のロックファイルに固定し、無人実行前に差分軸を数える preflight の実装
一度に動かす軸を1つに絞る『変更予算』の考え方と、回帰時に原因軸を二分で切り分ける手順
4サイトの記事生成を毎日エージェントに任せる運用で、原因特定にかかる時間がどう変わったかの実測ログ
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Antigravity Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Agents & Manager2026-05-29
Antigravity 長時間実行エージェントの監視設計 — watchdog と段階的リカバリ
AdMob 収益最適化を 8 週間バックグラウンドエージェントに任せて見えた、長時間タスクが静かに停止する 3 つの故障モード。watchdog タイマーと段階的リカバリの実装メモを残します。
Agents & Manager2026-05-27
Antigravity Agent の Record & Replay — 失敗を3分で再現する本番運用パターン
Antigravity の自律エージェントが本番で失敗した瞬間を、後からオフラインで決定的に再生する Record & Replay の設計と実装。Dolice Labs 4 サイトを並行運用してきた経験から、ストレージ設計・PII マスク・ハーネスのコードまで具体的に解説します。
Agents & Manager2026-05-25
Antigravity エージェントのコスト按分設計 — 複数プロダクトで実行コストをテナントに帰着させる Showback アーキテクチャ
Antigravity の AI エージェントを複数プロダクトで並行運用する際の実行コストを、テナント単位で正しく按分する Showback アーキテクチャを、4 サイト × 6 アプリの実運用ログを添えて整理しました。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →