Antigravity CLI への切り替え当日、出力ではなく副作用の等価性で本番自動化を検証する

Gemini CLI から Antigravity CLI へ切り替える当日に、標準出力の一致ではなく副作用（書き込んだファイル・コミット・ネットワーク呼び出し）の等価性で本番自動化を検証する方法です。サンドボックスでの並走と切り替え可否ゲートを実装の手順で整理しました。

antigravity³⁷⁴ antigravity-cli⁶ migration⁷ ci² automation³⁴

✦ プレミアム記事

本日6月18日、Gemini CLI と Gemini Code Assist IDE 拡張が、無料の個人利用と AI Pro / Ultra 向けのリクエスト提供を終了し、後継の Antigravity CLI へ統合されます。CLI を使った自動化を組んでいる人にとっては、今日が切り替えの節目です。

ここで多くの移行検証がやりがちなのが、新旧の標準出力を比べて「同じ文字列が出るか」を見ることです。私自身、最初はそれで十分だと思っていました。ところが、自動化が実際に価値を生むのは標準出力ではなく副作用——ファイルを書き、コミットを作り、外部 API を叩く部分です。出力が一字一句同じでも、書き込み先が1つずれていれば本番は壊れます。だから検証は、出力ではなく副作用の等価性で行うべきです。

なぜ出力一致では足りないのか

CLI エージェントの仕事は、たいてい画面に何かを表示することではありません。リポジトリにファイルを生成し、変更をコミットし、デプロイ用の API を呼ぶ。標準出力はそのついでに流れるログにすぎません。

つまり、出力の一致は「同じことをログに書いた」ことしか保証しません。新旧 CLI が内部でツールを呼ぶ順番や引数が微妙に変わっていても、ログが似ていれば気づけない。私はこの落とし穴に一度ハマって、出力は同じなのに書き込んだファイルのパスだけが違う、という事故に近い状況を経験しました。

副作用を3つの面で捉える

副作用は、観測できる3つの面に分けると扱いやすくなります。この3面が新旧で一致すれば、本番に載せても挙動は同じだと言えます。

面	観測対象	取り方
ファイル	作成・変更・削除されたパスと内容	実行前後のスナップショット差分
Git	生成されたコミットの diff とメッセージ	`git diff` と `git log`
ネットワーク	宛先ホスト・メソッド・回数	送信プロキシのアクセスログ

このうち最も事故が多いのはファイル面です。出力検証ではまず捕まえられません。

✦

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること

✦標準出力ではなく副作用の等価性で移行を検証する考え方と、その3つの観測面

✦新旧CLIを同じ入力でサンドボックス並走させ、書き込み差分を取る実装

✦ネットワーク呼び出しの等価性を確認し、切り替え可否を機械判定するゲートの手順

Stripe による安全な決済 · いつでもキャンセル可能

✦

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または

メンバーシップなら全記事が読み放題 →

サンドボックスで両CLIを同じ入力に当てる

検証は、本番とは隔離した作業ディレクトリで行います。同じ入力（プロンプトと対象リポジトリのコピー）を、新旧それぞれの CLI に与え、終わったら状態を比べます。

#!/usr/bin/env bash
set -euo pipefail
INPUT_PROMPT="$1"            # 同一のタスク指示
SRC="$2"                     # 対象リポジトリ
 
run_one() {
  local cli="$1" outdir="$2"
  rm -rf "$outdir" && cp -r "$SRC" "$outdir"
  ( cd "$outdir" && "$cli" run --prompt "$INPUT_PROMPT" \
      > "../$(basename "$outdir").stdout" 2>&1 )
}
 
run_one gemini    sandbox_old   # 旧CLI
run_one agy       sandbox_new   # Antigravity CLI（後継）
echo "両CLIの実行が完了しました。副作用を比較します。"

ポイントは、毎回まっさらなコピーから始めることです。前回の残骸が混ざると、差分が CLI の違いなのか実行順の違いなのか判別できなくなります。

書き込んだファイルの差分を取る

実行後、2つのサンドボックスを丸ごと比較します。diff -r で十分です。ここで差分がゼロなら、ファイル面の副作用は等価です。

# ファイル面の等価性チェック（.git は別途比較するので除外）
if diff -r --exclude=.git sandbox_old sandbox_new > file_diff.txt; then
  echo "✅ ファイル副作用: 等価"
else
  echo "❌ ファイル副作用に差分あり:"
  head -40 file_diff.txt
fi
 
# Git面: 生成されたコミットの diff を比較
( cd sandbox_old && git diff HEAD~1 HEAD ) > old.patch 2>/dev/null || true
( cd sandbox_new && git diff HEAD~1 HEAD ) > new.patch 2>/dev/null || true
diff old.patch new.patch && echo "✅ Git副作用: 等価" || echo "❌ コミット内容に差分あり"

私はこの diff を最初に回したとき、本文は完全に一致しているのに改行コードだけ CRLF と LF で割れている、という差分に出くわしました。出力検証なら絶対に見逃していた違いです。こうした細部こそ、本番でビルドを壊します。

ネットワーク呼び出しの等価性を確認する

3面目はネットワークです。新旧で叩く宛先や回数が変わると、レート制限や課金に直結します。送信プロキシを1枚かませて、アクセスログを比べるのが確実です。

宛先ホストとメソッドの集合が一致しているか、呼び出し回数が大きくずれていないかを見ます。経験上、回数が約20%以上ずれていたら、内部のツール呼び出し設計が変わったサインです。等価でないまま本番に載せると、想定外の課金やレート制限を踏みます。経験上ここは厳しめが安全で、私は20%を上限の目安として推奨します。