ANTIGRAVITY LABEN
記事一覧/Agents & Manager
Agents & Manager/2026-06-27上級

モデルを乗り換える前に、エージェントの出力をゴールデンスナップショットで固定する

Antigravity のエンジンが Gemini 3.5 Flash へ切り替わるタイミングで、エージェントの出力が静かに変わってしまう問題を、ゴールデンスナップショットによる回帰ゲートで捕まえる設計を、実際のテストコードと移行手順とともにまとめました。

Antigravity279agent-design9regression2testing13model-migration

プレミアム記事

エンジンが新しいモデルに置き換わった朝、エージェントは前日と同じプロンプトを受け取って、前日と少しだけ違う出力を返しました。エラーは出ていません。ログも正常です。けれど、生成された記事のフロントマターから tags のひとつが消えていました。

私は個人開発で複数のサイトを一人で運用していて、夜間にエージェントが下書きを作る仕組みを動かしています。出力が「壊れる」なら気づけます。怖いのは、出力が「少しだけ良くも悪くもない方向にずれる」ことです。Gemini 3.5 Flash のように高速で賢いモデルへ移っても、この静かなずれは必ず起きます。

なぜモデル移行で出力が静かに変わるのか

ずれの経路は、大きく3つあります。

ひとつ目は、フォーマットの揺れです。同じ「JSON で返して」という指示でも、新しいモデルはキーの順序や空配列の扱いを変えることがあります。ふたつ目は、省略の癖です。賢いモデルほど「自明だから省く」判断をして、以前は明示していた項目を落とします。みっつ目は、語調です。要約の長さや断定の強さが変わり、後段の処理が前提にしていた長さの範囲を外れます。

どれも単体では小さく、テストが「成功」と表示し続けます。だからこそ、移行前の出力を一度きちんと固定しておく必要があります。

ゴールデンスナップショットという考え方

ゴールデンスナップショットは、現時点で「これは正しい」と人間が認めた出力を、ファイルとして保存したものです。次回以降は、エージェントの出力をこの保存済みの正解と突き合わせます。

ポイントは、文字列の完全一致を目指さないことです。生成 AI の出力は本質的に揺れます。固定すべきなのは表面の文字列ではなく、後段が依存している構造と不変条件です。たとえば「フロントマターに必須キーが7つ揃っている」「本文の H2 が6個以上ある」「内部リンクが実在する記事だけを指している」といった性質です。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
モデル移行で出力が静かにずれる3つの経路と、どこをスナップショットで固定すべきかの判断軸
完全一致ではなく構造と不変条件で差分を判定する、実運用に耐えるゴールデンテストの書き方
Gemini 3.5 Flash への切り替え当日に踏む、固定・差分確認・承認の具体手順
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Antigravity Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Agents & Manager2026-06-27
自律エージェントの行動を、改ざんを検知できる監査ログに残す
Antigravity のエージェントが自律的に下した判断と実行を、後から追跡・検証できる形で残すために、ハッシュチェーンで改ざんを検知できる追記専用の監査ログを設計する方法を、実装コードとともにまとめました。
Agents & Manager2026-06-27
一度きりのプロンプトを、再利用できるサブエージェントに残す
Antigravity 2.0 の dynamic sub-agents で生まれた『うまくいったプロンプト』を、会話履歴に埋もれさせず再利用可能な定義として残す方法を、実際のファイル構成と蒸留手順とともにまとめました。
Agents & Manager2026-06-27
エージェント自動運用が壊れた朝に、何分で戻せるか — 復旧の3層設計
Antigravity 2.0 でデスクトップ・CLI・SDK と運用面が増えるほど、壊れたときに戻す対象も増えます。個人開発で複数サイトを自動運用してきた立場から、認証・定義・状態の3層で復旧可能性を保つ設計と、月1回の復元訓練の手順をまとめます。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →