◈ Agents & Manager/2026-04-11上級

AIエージェント・オーケストレーション：マルチエージェントシステムの設計と実装

マルチエージェントシステムにおけるオーケストレーションの設計パターンを体系的に解説。LLMを活用したエージェント間の調整・委譲・フィードバックループの実装方法を、実践的なコード例とともに紹介します。

エージェント⁴⁴ オーケストレーション⁷ マルチエージェント³⁸ LLM² 自動化²¹ AI設計

✦ プレミアム記事

「AIエージェント」という言葉が広まる一方で、単一エージェントの限界も見えてきましました。複雑なタスクを処理するには、複数のエージェントが協調して動くマルチエージェントシステムが必要になります。

その中核を担うのが「オーケストレーション」——エージェント群を指揮し、タスクを適切に分配・調整する仕組みです。ここで扱うのはエージェントオーケストレーションの設計パターンから実装まで、実務に役立つ知識を体系的に解説します。

なぜマルチエージェントが必要か

単一エージェントは、シンプルなタスクに対して非常に効率的です。しかし、現実のビジネスプロセスはそう単純ではありません。

単一エージェントの限界

コンテキストウィンドウの制約: 最新のLLMでも、処理できる情報量には上限があります。長大なドキュメントの分析や、多段階にわたる複雑なタスクでは、コンテキストウィンドウがボトルネックになります。

専門性の欠如: 1つのエージェントがあらゆるタスクに対応しようとすると、プロンプトが複雑になり、出力の品質が低下します。会計処理のプロフェッショナルと法務レビューの専門家を同一人物に求めるようなものです。

並列処理の不可能性: 単一エージェントは本質的にシーケンシャルです。独立したタスクAとタスクBがある場合でも、一方が完了するまで他方を開始できません。

エラー伝播のリスク: 単一エージェントがエラーを起こすと、ワークフロー全体が停止します。分離された複数エージェントなら、一部の失敗が全体に波及しにくくなります。

マルチエージェントが解決すること

マルチエージェントシステムでは、これらの課題を次のように解決します。各エージェントは明確に定義された役割と、その役割に必要なツールのみを持ちます。エージェント間の通信は構造化されたプロトコルで行われ、並列実行が可能です。そして、一部のエージェントの失敗が全体を止めない「耐障害性」が生まれます。

オーケストレーションの4つの基本パターン

パターン1：中央集権型オーケストレーター

最も一般的なパターンです。中央のオーケストレーターがすべての判断を行い、サブエージェントに指示を送ります。

ユーザー
  ↓
オーケストレーター（中央指揮）
  ├── 指示 → サブエージェントA
  ├── 指示 → サブエージェントB
  └── 指示 → サブエージェントC
        ↑
     結果を集約してユーザーへ返す

利点: 全体の状態を1か所で管理できるため、デバッグが容易。タスクの依存関係を明示的に制御できます。

欠点: オーケストレーター自体がSPOF（Single Point of Failure）になるリスク。オーケストレーターのコンテキストが肥大化しやすい。

適した場面: タスク間に複雑な依存関係がある場合、厳密な実行順序の制御が必要な場合。

パターン2：分散型ピアツーピア

エージェントが相互に通信し、中央指揮なしに協調します。

エージェントA ←→ エージェントB
     ↕                ↕
エージェントC ←→ エージェントD

利点: 単一障害点がありません。各エージェントが独立してスケールできます。

欠点: 全体の状態把握が難しいです。デッドロックや無限ループのリスクがあります。

適した場面: 各エージェントの役割が明確で独立性が高い場合。ピアレビューや相互検証が必要な場合。

パターン3：階層型マルチレベル

オーケストレーターが複数の中間マネージャーを通じてリーフエージェントを管理します。

トップオーケストレーター
  ├── マネージャーA
  │     ├── ワーカーA1
  │     └── ワーカーA2
  └── マネージャーB
        ├── ワーカーB1
        └── ワーカーB2

利点: 大規模システムへのスケーラビリティ。各階層での責任分離。

欠点: レイテンシの増加。階層間のコミュニケーションオーバーヘッド。

適した場面: 複数の独立したサブシステムを統合する大規模ワークフロー。

パターン4：動的エージェント生成

オーケストレーターがタスクの内容に応じて、必要なエージェントを動的に生成・破棄します。

def dynamic_orchestrator(task: str) -> str:
    """タスク分析に基づいて必要なエージェントを動的生成"""
    
    # タスク分析フェーズ
    task_analysis = analyze_task(task)
    required_agents = task_analysis["agents_needed"]
    
    # エージェントを動的に初期化
    active_agents = {}
    for agent_spec in required_agents:
        active_agents[agent_spec["id"]] = create_agent(
            role=agent_spec["role"],
            tools=agent_spec["tools"],
            system_prompt=agent_spec["prompt"]
        )
    
    # タスク実行
    results = execute_with_agents(task, active_agents)
    
    # リソース解放
    for agent in active_agents.values():
        agent.cleanup()
    
    return results

利点: リソースの効率的な使用。タスクに最適化されたエージェント構成。

適した場面: タスクの種類が多様で、事前に必要なエージェントを特定できない場合。

✦

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること

✦マルチエージェントシステムの主要アーキテクチャパターンとその使い分けの判断基準

✦オーケストレーターとサブエージェントの役割分担・通信プロトコル・状態管理の実装手法

✦本番運用で直面するスケーリング・信頼性・コスト課題と実践的な解決アプローチ

Stripe による安全な決済 · いつでもキャンセル可能

✦

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または

メンバーシップなら全記事が読み放題 →

オーケストレーターの実装：詳細解説

実際にオーケストレーターを実装する際の重要なポイントを順を追って説明します。

タスク分解エンジン

オーケストレーターの核心は、複雑なタスクを実行可能な小タスクに分解する能力です。

from anthropic import Anthropic
import json
 
client = Anthropic()
 
def decompose_task(task: str, available_agents: list[dict]) -> list[dict]:
    """
    LLMを使ってタスクを分解し、各サブタスクをエージェントに割り当てる
    """
    decompose_prompt = f"""
    あなたはタスク分解の専門家です。以下のタスクを、利用可能なエージェントで実行可能な
    サブタスクに分解してください。
    
    メインタスク: {task}
    
    利用可能なエージェント:
    {json.dumps(available_agents, ensure_ascii=False, indent=2)}
    
    以下のJSON形式で回答してください:
    {{
        "subtasks": [
            {{
                "id": "task_1",
                "description": "サブタスクの説明",
                "assigned_agent": "エージェントID",
                "depends_on": [],
                "can_parallel": true
            }}
        ],
        "execution_order": [["task_1", "task_2"], ["task_3"]]
    }}
    
    execution_orderは並列実行可能なグループを表す二次元配列です。
    """
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=4096,
        messages=[{"role": "user", "content": decompose_prompt}]
    )
    
    result = json.loads(response.content[0].text)
    return result
 
def execute_task_plan(plan: dict, agents: dict) -> dict:
    """実行計画に従ってタスクを順次・並列実行"""
    results = {}
    
    for parallel_group in plan["execution_order"]:
        if len(parallel_group) == 1:
            # シーケンシャル実行
            task_id = parallel_group[0]
            subtask = next(t for t in plan["subtasks"] if t["id"] == task_id)
            agent = agents[subtask["assigned_agent"]]
            
            # 依存タスクの結果を注入
            context = {dep: results[dep] for dep in subtask["depends_on"]}
            results[task_id] = agent.execute(subtask["description"], context)
        else:
            # 並列実行
            import concurrent.futures
            with concurrent.futures.ThreadPoolExecutor() as executor:
                futures = {}
                for task_id in parallel_group:
                    subtask = next(t for t in plan["subtasks"] if t["id"] == task_id)
                    agent = agents[subtask["assigned_agent"]]
                    context = {dep: results[dep] for dep in subtask["depends_on"]}
                    futures[task_id] = executor.submit(
                        agent.execute, subtask["description"], context
                    )
                
                for task_id, future in futures.items():
                    results[task_id] = future.result()
    
    return results

エージェント間の状態共有

マルチエージェントシステムでは、エージェント間で状態を共有するための仕組みが必要です。

from dataclasses import dataclass, field
from typing import Any, Dict
import threading
 
@dataclass
class SharedWorkspace:
    """エージェント間で共有される作業スペース"""
    artifacts: Dict[str, Any] = field(default_factory=dict)
    messages: list = field(default_factory=list)
    _lock: threading.RLock = field(default_factory=threading.RLock)
    
    def write_artifact(self, key: str, value: Any, agent_id: str):
        """アーティファクトの書き込み（スレッドセーフ）"""
        with self._lock:
            self.artifacts[key] = {
                "value": value,
                "written_by": agent_id,
                "timestamp": __import__("datetime").datetime.utcnow().isoformat()
            }
    
    def read_artifact(self, key: str) -> Any:
        """アーティファクトの読み取り"""
        with self._lock:
            item = self.artifacts.get(key)
            return item["value"] if item else None
    
    def post_message(self, from_agent: str, to_agent: str, content: str):
        """エージェント間メッセージング"""
        with self._lock:
            self.messages.append({
                "from": from_agent,
                "to": to_agent,
                "content": content,
                "timestamp": __import__("datetime").datetime.utcnow().isoformat()
            })
    
    def get_messages_for(self, agent_id: str) -> list:
        """特定エージェント宛のメッセージを取得"""
        with self._lock:
            return [m for m in self.messages if m["to"] == agent_id]

フィードバックループとクオリティゲート

高品質な出力を保証するために、エージェントの出力を評価してフィードバックを返すループが重要です。

def quality_gate(output: str, criteria: dict) -> dict:
    """
    エージェントの出力品質を評価するクオリティゲート
    """
    evaluation_prompt = f"""
    以下の出力を評価してください。
    
    出力:
    {output}
    
    評価基準:
    {json.dumps(criteria, ensure_ascii=False)}
    
    JSON形式で回答:
    {{
        "passed": true/false,
        "score": 0-100,
        "issues": ["問題点1", "問題点2"],
        "improvement_suggestions": ["改善案1", "改善案2"]
    }}
    """
    
    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=1024,
        messages=[{"role": "user", "content": evaluation_prompt}]
    )
    
    return json.loads(response.content[0].text)
 
def iterative_refinement(
    task: str,
    agent,
    criteria: dict,
    max_iterations: int = 3
) -> str:
    """品質基準を満たすまで反復的に改善"""
    
    result = agent.execute(task)
    
    for i in range(max_iterations):
        quality = quality_gate(result, criteria)
        
        if quality["passed"]:
            return result
        
        # 改善フィードバックを含めて再実行
        improvement_task = f"""
        元のタスク: {task}
        
        前回の出力:
        {result}
        
        改善すべき点:
        {json.dumps(quality["improvement_suggestions"], ensure_ascii=False)}
        
        上記の改善点を踏まえて、より良い出力を生成してください。
        """
        result = agent.execute(improvement_task)
    
    return result  # 最大試行回数後の最良の結果を返す

実践ユースケース：マルチエージェントで構築するコンテンツ制作パイプライン

理論を実際のシナリオで確認しましょう。ブログ記事を自動生成するマルチエージェントパイプラインを例にとります。

システムアーキテクチャ

ユーザー（トピック指定）
  ↓
オーケストレーター
  ├── [並列] リサーチエージェント群
  │     ├── ウェブ検索エージェント
  │     ├── 学術論文検索エージェント
  │     └── 競合コンテンツ分析エージェント
  ├── [シーケンシャル] コンテンツ制作エージェント群
  │     ├── アウトライン作成エージェント
  │     ├── ドラフト執筆エージェント
  │     └── 編集・校正エージェント
  └── [最終] 品質検証エージェント
        ├── 事実確認エージェント
        ├── SEO最適化エージェント
        └── 最終承認エージェント

各エージェントの役割と実装

class ResearchAgent:
    def __init__(self, search_tools: list):
        self.tools = search_tools
        self.system_prompt = """あなたは優れたリサーチャーです。
        指定されたトピックについて、信頼性の高い情報源から情報を収集し、
        構造化された形式でまとめてください。"""
    
    def execute(self, topic: str, context: dict = None) -> dict:
        research_prompt = f"以下のトピックについて詳しく調査してください: {topic}"
        
        response = client.messages.create(
            model="claude-opus-4-6",
            max_tokens=8192,
            system=self.system_prompt,
            tools=self.tools,
            messages=[{"role": "user", "content": research_prompt}]
        )
        
        return {
            "findings": response.content[0].text,
            "sources": self._extract_sources(response)
        }
 
class WritingAgent:
    def __init__(self):
        self.system_prompt = """あなたは経験豊富なテクニカルライターです。
        リサーチ結果を基に、読みやすく情報量の豊富な記事を執筆してください。
        見出しには具体的で魅力的なタイトルを使い、コード例は実際に動作するものを提供してください。"""
    
    def execute(self, outline: str, research_data: dict) -> str:
        writing_prompt = f"""
        以下のアウトラインと調査データを基に、記事本文を執筆してください。
        
        アウトライン:
        {outline}
        
        調査データ:
        {json.dumps(research_data, ensure_ascii=False)}
        
        要件:
        - 各セクションを十分な深さで解説する
        - 実践的なコード例を含める
        - 読者が実際に活用できる知識を提供する
        """
        
        response = client.messages.create(
            model="claude-opus-4-6",
            max_tokens=16384,
            system=self.system_prompt,
            messages=[{"role": "user", "content": writing_prompt}]
        )
        
        return response.content[0].text

スケーリングと本番運用の課題

マルチエージェントシステムを本番環境で運用する際の現実的な課題と解決策を紹介します。

コスト管理

マルチエージェントシステムはAPI呼び出し数が多くなるため、コスト管理が特に重要です。

トークン予算制: 各エージェントに割り当てるトークン上限を設定し、予算内に収める。

class BudgetAwareAgent:
    def __init__(self, max_tokens: int = 4096, model: str = "claude-sonnet-4-6"):
        self.max_tokens = max_tokens
        self.model = model
        self.tokens_used = 0
    
    def execute(self, task: str) -> str:
        if self.tokens_used > self.max_tokens * 0.9:
            # 予算残量が10%を切ったら軽量モデルにフォールバック
            self.model = "claude-haiku-4-5"
        
        response = client.messages.create(
            model=self.model,
            max_tokens=min(2048, self.max_tokens - self.tokens_used),
            messages=[{"role": "user", "content": task}]
        )
        
        self.tokens_used += response.usage.input_tokens + response.usage.output_tokens
        return response.content[0].text

デッドロック防止

エージェント間の循環依存はデッドロックを引き起こします。タイムアウトとサーキットブレーカーを組み合わせることで防止できます。

import asyncio
 
async def execute_with_timeout(agent, task: str, timeout: float = 30.0) -> str:
    """タイムアウト付きエージェント実行"""
    try:
        result = await asyncio.wait_for(
            asyncio.to_thread(agent.execute, task),
            timeout=timeout
        )
        return result
    except asyncio.TimeoutError:
        return f"ERROR: Agent timed out after {timeout}s"