ANTIGRAVITY LABEN
TAG

アービター

1 記事
タグ一覧に戻る
関連タグ:
antigravity1マルチエージェント1Best-of-N1検証1Gemini 3.5 Flash1運用設計1
エージェント/2026-06-17上級

複数案を出させたあと、どれを採用するか — 検証で裁定する Best-of-N の設計

Gemini 3.5 Flash の速さで、同じ実装を複数案つくらせるのは現実的になりました。難しいのは生成ではなく裁定です。多数決でも自己申告の自信でもなく、検証可能な信号だけで採用案を決める Best-of-N アービターの設計と TypeScript 実装を共有します。