はじめに
本記事では、タスク完遂のために「検索」「API連携」「コード実行」などの外部ツールを駆使するAIエージェントについて、arXiv論文と主要ベンダーの公式情報をベースに整理します。
エンジニアが自律エージェントを設計・実装する際のアーキテクチャ原則や主要コンポーネントを解説し、OSS/クラウド各社のフレームワーク/サービスを比較します。
※各社サービス比較は詳細を追記したい
1. AIエージェントの4段階ループ
AIエージェントは以下のサイクルを自律的に回しながらタスクを遂行します:
- 知覚(Perceive):ユーザー命令やイベントを受け取り
- 思考・計画(Think/Planning):目標達成のマルチステップ計画を立案
- 行動(Act/Tool Execution):検索やAPIコール、コード実行
- 学習・内省(Learn/Reflection):結果を評価し、次の計画に反映

THE LANDSCAPE OF EMERGING AI AGENT ARCHITECTURES FOR REASONING, PLANNING, AND TOOL CALLING: A SURVEY より
関連して、以下のプロトコルが普及しそうです。
- MCP (Model Context Protocol):Anthropicが提唱した、エージェント⇔外部ツール接続のオープンスタンダード。https://modelcontextprotocol.io/docs/getting-started/intro
- Agent2Agent (A2A):Googleが提唱した、エージェント間の対話・協調を標準化するオープンスタンダード。https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
2. 主要コンポーネントと代表的手法
2.1 メモリ(Memory)
- 短期メモリ:直近対話履歴やセッション状態の保持
- 長期メモリ:ベクトルDBへの埋め込み保存(例:AutoGPT、crewAI Memory)
2.2 プランナー/推論(Planner / Reasoning)
- ReAct:Chain-of-Thought とツール呼び出しを交互に行い、推論と行動を同期的に強化(Yao et al., 2022)
- Survey論文:計画(Planning)、実行(Execution)、内省(Reflection)の3フェーズ設計を推奨(Masterman et al., 2024)
2.3 ツール実行(Tool Execution)
-
Toolformer:自己教師ありで「いつ・どのAPIを呼ぶか」を学習(Schick et al., 2023)
-
Function Calling:JSON形式で関数呼び出し(Azure OpenAI, Bedrockなどが提供)
-
最新拡張:
- Azure:並列Function Calling、MCPツール接続
- AWS:Action groups、Code Interpreter
- Google:Agent2Agentによるクロスエージェント協調
2.4 フィードバック/内省(Feedback / Reflection)
- 自己批評:モデルが自分の出力を評価し改善案を生成(Reflexion, Shinn et al., 2023)
- 自律ループ:AutoGPT系は「評価→プラン修正→再実行」を自動化
3. OSS & クラウドサービスの比較(2025-08最新版)
| 種別 | 名称 | マルチエージェント対応 | メモリ | ツール連携 | 近況/特徴 |
|---|---|---|---|---|---|
| OSS | LangChain + LangGraph | ◎(監督者/ネットワーク公式) | ○(履歴+RAG) | ◎ 豊富なTool API | LangGraphでmulti-agent network提供 |
| AutoGen (Microsoft Research) | ◎(イベント駆動・スケール) | ○ | ○ 関数/外部ツール | v0.4で再設計、堅牢化 | |
| crewAI | ◎(役割分担+協調) | ○(短期/長期/MCP対応) | ○ LangChain統合等 | Memory体系+MCP接続が整備 | |
| MetaGPT | ◎(SOP/チーム型) | △(セッション中心) | ○ 開発特化 | 継続更新、MGX発表 | |
| クラウド | IBM watsonx Orchestrate | ◎(Collaborator agents) | ◎ マルチターン+外部KB | ◎ 業務アプリ接続+Agent Connect | 外部エージェント統合が進展 |
| AWS Bedrock Agents | ◎(マルチエージェント協調 GA) | ○(Agent Memory) | ◎(Action groups, Code Interpreter, MCP Gateway) | AgentCore群で運用性強化 | |
| Azure AI Foundry Agent Service | ◎(Connected agents) | ○(Threads/Storage) | ◎ Function Calling, Browser Automation, MCP | 2025/5 GA、VS Code統合 | |
| Google Vertex AI Agents | ◎(Agent2Agent+ADK) | ◎(Memory bank) | ◎ Search/Maps/コネクタ+MCP | クロスベンダー連携を推進 |
参考資料
手法・理論
- Yao et al., 2022. ReAct: Synergizing Reasoning and Acting in Language Models arXiv:2210.03629
- Schick et al., 2023. Toolformer arXiv:2302.04761
- Shinn et al., 2023. Reflexion arXiv:2303.11366
- Masterman et al., 2024. Survey on AI Agent Architectures arXiv:2404.11584
- Survey: The Rise and Potential of LLM-based Agents arXiv:2309.07864
プロトコル
- MCP (Model Context Protocol) https://modelcontextprotocol.io
- Agent2Agent (Google) Google Cloud Blog