ANTIGRAVITY LABEN
記事一覧/Agents & Manager
Agents & Manager/2026-06-25上級

大型更新で無人実行が一晩で止まる前に — バージョンを段階導入するカナリアゲートの設計

大型更新の直後に無人実行が半分しか通らなくなった経験から、動作中の構成を凍結し、隔離プロファイルのカナリア検証で合否を判定してから本採用する段階導入ゲートの設計を、bashとPythonの実装とともにまとめます。

antigravity390agents76automation41version-pinningcanary

プレミアム記事

先日の大型更新を取り込んだ翌朝、いつもなら静かに終わっているはずの無人実行のログに、見慣れない失敗が並んでいました。夜のうちに走るタスクのうち三割ほどが途中で止まっていて、原因を追う朝になったのです。

調べてみると、コードのバグではありませんでした。前日まで問題なく動いていた構成が、更新によって静かに置き換わっていたことが理由でした。私は個人開発で作った壁紙アプリや癒し系アプリを Google Play と App Store に出しながら、その更新作業や記事運用の多くを Antigravity のエージェントに任せています。だからこそ、足場そのものが一晩で変わると、寝ている間に積み上がるはずだった成果が静かに崩れます。

新機能を早く使いたい気持ちと、無人で回している土台を壊したくない気持ちは、いつも綱引きをしています。その綱引きに毎回悩まないための「段階導入カナリアゲート」という仕組みを、実際に組んだ形で以下に共有します。

一晩で半分しか通らなくなった朝

最初に起きたことを正確に書きます。更新を取り込んだのは前日の夜で、その時点では手元で一つ二つコマンドを試して、問題なく動いたので安心して寝ました。ところが翌朝、無人実行の初回成功率が普段の約98%から約63%まで落ちていました。

厄介だったのは、失敗が一様ではなかった点です。あるタスクは出力の形式が変わったために後段の処理が読み取れず、別のタスクは応答の傾向が変わって品質ゲートに弾かれていました。手元で叩いた数コマンドが「たまたま壊れていない経路」だったために、寝る前の確認をすり抜けていたのです。

この一件で私が痛感したのは、大型更新は単一の変更ではないということです。一つの更新が、同時に複数の前提を書き換えます。

更新が同時に動かす三つの変数

更新で何が壊れるのかを、私は三つの変数に分けて考えるようにしました。ひとつずつ別の壊れ方をするので、まとめて「更新」とだけ捉えると原因の切り分けに時間がかかります。

更新で動く変数典型的な壊れ方凍結して守る対象
CLI 本体のバージョンサブコマンドや出力フォーマットが変わり、後段のパースが崩れるantigravity のバージョン番号
拡張・プラグイン自動更新で API が非互換になり、無言で挙動が変わる拡張一覧のハッシュ
既定モデル既定が差し替わり、同じ指示でも出力傾向が変化するmodel.default の値

私の失敗の原因は、三つ目の「既定モデルの差し替え」と一つ目の「出力フォーマットの変化」が同時に起きていたことでした。どちらか片方だけなら気づけたかもしれませんが、重なると症状が混ざり、切り分けが難しくなります。

だからこそ、復旧を運任せにせず、更新の前後で「何が動いたか」を機械が説明できる状態にしておく価値があります。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
大型更新の直後に無人実行の成功率が約98%から約63%へ落ちた事例から、何が同時に壊れるのかを三つの変数で切り分けます
構成マニフェスト env.lock.json で動作中の CLI・拡張・既定モデルを凍結し、更新を一手で巻き戻せる状態を作る bash と Python の実装
カナリア検証ランナーでゴールデン出力と照合し、終了コード契約で自動投稿パイプラインへの本採用を機械的にゲートする手順
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Antigravity Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Agents & Manager2026-06-19
複数エージェントをどう束ねるか: 並列化する仕事と直列に残す仕事の線引き
Antigravity 2.0 で複数エージェントの真の並列実行が可能になりました。ただ全部を並列にすれば速くなるわけではありません。どの作業を並列に分け、どこを直列のまま残すか。依存関係と競合の観点から、破綻しないオーケストレーション設計を考えます。
Agents & Manager2026-06-18
Antigravity 2.0 のエージェントに任せる前に引く、3本の境界線
バックグラウンドエージェントに何を任せ、何を手元に残すか。個人開発の並行運用で実際に引いた3本の境界線と、それをコードに落とすための具体的なパターンをまとめました。
Agents & Manager2026-06-16
Gemini API の Managed Antigravity Agent で多言語リリースノートを生成する実装メモ
Gemini API 経由で公開プレビューになった Managed Antigravity Agent を使い、git のコミットログから App Store / Google Play 向けの多言語リリースノートを生成するパイプラインを実装した記録です。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →