ANTIGRAVITY LABEN
記事一覧/AIツール
AIツール/2026-06-13上級

並列エージェントがクォータを静かに使い切る — 上限が見えない環境での自衛サーキットブレーカー設計

AI Ultra の高い上限でも、並列エージェントを走らせると利用枠を予告なく使い切り、後続が中途半端に失敗します。上限が外から見えない前提で、自分側に消費を記録しブレーキをかけるサーキットブレーカーの設計を、実運用の体感とあわせてまとめました。

ai-tools12rate-limiting2circuit-breaker3parallel-execution4quota4

プレミアム記事

並列で5本走らせていたエージェントの3本目以降が、揃って中途半端な出力で止まったことがあります。

AI Ultra に上げてから、上限を気にせず並列でエージェントを回せるようになった、と思っていました。ところが朝にまとめて重い処理を投げた日、後半のエージェントだけが、途中まで動いてから明確なエラーも出さずに薄い結果を返しました。最初はモデルの調子かと思いましたが、時間帯を変えると再現しません。利用枠を短時間に使い切っていたのです。

やっかいなのは、この枯渇が「429 を返して止まる」という分かりやすい形では来ないことでした。私自身、エラーコードを待つ受け身の作りのままで、何度か後半の成果物を無駄にしました。上限が外から見えない前提で、自分側にブレーキを作る設計を、実運用の体感とあわせて順に組み立てていきます。

クォータ枯渇は明確なエラーとして来ない

レート制限というと、HTTP 429 が返ってリトライすれば直る、というイメージがあります。エージェント型のツールでは、必ずしもそうなりません。

実運用で観察した枯渇の現れ方は、おおむね次の3パターンでした。ひとつは途中での品質低下です。複数ステップの作業のうち、序盤は通常どおり進み、後半のステップだけ短い・浅い出力になります。ふたつ目は無音の打ち切りです。エージェントが「完了」と報告するのに、成果物が途中までしかありません。みっつ目は体感の鈍化で、応答が極端に遅くなり、タイムアウト境界で失敗します。

共通するのは、どれも「クォータを使い切った」という明示信号を伴わないことです。Ultra のような上位プランは上限が高い反面、残量がどれだけあるかが外から正確には見えません。だからこそ、エラーコードに頼った受け身の対処では遅いのです。枯渇を検知してから止めるのではなく、枯渇する前に自分で止める。これがサーキットブレーカーの発想です。

自分側で消費を推定して記録する

外から残量が見えないなら、自分が投入した量を自分で数えるしかありません。正確なトークン数は取れなくても、近似で十分です。私は「1エージェント実行 = 概算トークン」という粗い見積もりを、実行ごとにファイルに追記しています。

# record_usage.sh <weight>
# 1日の消費を概算トークンの重みで積算する(日付ごとにリセット)
DAY="$(TZ=Asia/Tokyo date +%F)"
LEDGER="$HOME/.agent_quota/${DAY}.tally"
mkdir -p "$HOME/.agent_quota"
 
WEIGHT="${1:-1000}"   # この実行の概算重み(重い生成ほど大きく)
echo "$WEIGHT" >> "$LEDGER"
 
TOTAL="$(awk '{s+=$1} END{print s+0}' "$LEDGER")"
echo "本日累計(概算): $TOTAL"

重みは厳密でなくてかまいません。軽いトリアージは 500、通常の記事生成は 3000、ブラウザサブエージェントを伴う重い処理は 8000、といった「相対的な目方」を決めておけば、1日の消費の山がどれくらいかを掴めます。日付を TZ=Asia/Tokyo で固定しているのは、日付境界がずれて前日の台帳を上書きする事故を避けるためです。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
クォータ枯渇が「明確なエラー」ではなく「途中での品質低下・無音失敗」として現れる理由を理解できる
自分側で消費量を推定して記録し、しきい値でエージェント投入を止める自衛サーキットブレーカーを bash で構築できる
上限が不透明な環境で、1日の作業を枯渇させずに配分するトークン予算の引き方が分かる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Antigravity Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

AIツール2026-05-11
アーティストとして Antigravity を制作補助に3ヶ月使って見えてきたもの
国際芸術賞17冠のアーティストとして、Antigravity をアート制作の補助ツールとして使い続けた3ヶ月の記録。コーディングの補助だけでなく、創作プロセスのどの部分を委ねられるか、どこは自分の手を離してはいけないか。正直な評価をまとめました。
AIツール2026-04-14
Gemma 4のImplicit Cachingをアンチグラビティで活かす——同じコードを何度も読み込ませるコストを削減させる方法
Gemma 4のImplicit Caching機能をAntigravityで最大限に活用する実践ガイド。大規模コードベースでのクレジット消費を大幅に削減するプロジェクト設計術を解説します。
AIツール2026-04-09
Hugging Face Transformers のエラー対処ガイド — 原因の見分け方と解決手順
Hugging Face Transformersで起きやすいエラーを症状別に整理。ImportError、CUDA OOM、bf16非対応GPU、ゲート付きモデルの401、キャッシュ肥大化まで、原因の見分け方と解決手順をまとめます。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →