AIエージェントアーキテクチャの整理と実践的サービス比較

Posted at 2025-08-17

はじめに

本記事では、タスク完遂のために「検索」「API連携」「コード実行」などの外部ツールを駆使するAIエージェントについて、arXiv論文と主要ベンダーの公式情報をベースに整理します。
エンジニアが自律エージェントを設計・実装する際のアーキテクチャ原則や主要コンポーネントを解説し、OSS／クラウド各社のフレームワーク／サービスを比較します。
※各社サービス比較は詳細を追記したい

1. AIエージェントの4段階ループ

AIエージェントは以下のサイクルを自律的に回しながらタスクを遂行します：

知覚（Perceive）：ユーザー命令やイベントを受け取り
思考・計画（Think/Planning）：目標達成のマルチステップ計画を立案
行動（Act/Tool Execution）：検索やAPIコール、コード実行
学習・内省（Learn/Reflection）：結果を評価し、次の計画に反映

THE LANDSCAPE OF EMERGING AI AGENT ARCHITECTURES FOR REASONING, PLANNING, AND TOOL CALLING: A SURVEY より

関連して、以下のプロトコルが普及しそうです。

MCP (Model Context Protocol)：Anthropicが提唱した、エージェント⇔外部ツール接続のオープンスタンダード。https://modelcontextprotocol.io/docs/getting-started/intro
Agent2Agent (A2A)：Googleが提唱した、エージェント間の対話・協調を標準化するオープンスタンダード。https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

2. 主要コンポーネントと代表的手法

2.1 メモリ（Memory）

短期メモリ：直近対話履歴やセッション状態の保持
長期メモリ：ベクトルDBへの埋め込み保存（例：AutoGPT、crewAI Memory）

2.2 プランナー／推論（Planner / Reasoning）

ReAct：Chain-of-Thought とツール呼び出しを交互に行い、推論と行動を同期的に強化（Yao et al., 2022）
Survey論文：計画（Planning）、実行（Execution）、内省（Reflection）の3フェーズ設計を推奨（Masterman et al., 2024）

2.3 ツール実行（Tool Execution）

Toolformer：自己教師ありで「いつ・どのAPIを呼ぶか」を学習（Schick et al., 2023）
Function Calling：JSON形式で関数呼び出し（Azure OpenAI, Bedrockなどが提供）
最新拡張：
- Azure：並列Function Calling、MCPツール接続
- AWS：Action groups、Code Interpreter
- Google：Agent2Agentによるクロスエージェント協調

2.4 フィードバック／内省（Feedback / Reflection）

自己批評：モデルが自分の出力を評価し改善案を生成（Reflexion, Shinn et al., 2023）
自律ループ：AutoGPT系は「評価→プラン修正→再実行」を自動化

3. OSS & クラウドサービスの比較（2025-08最新版）

種別	名称	マルチエージェント対応	メモリ	ツール連携	近況/特徴
OSS	LangChain + LangGraph	◎（監督者/ネットワーク公式）	○（履歴＋RAG）	◎ 豊富なTool API	LangGraphでmulti-agent network提供
	AutoGen (Microsoft Research)	◎（イベント駆動・スケール）	○	○ 関数/外部ツール	v0.4で再設計、堅牢化
	crewAI	◎（役割分担＋協調）	○（短期/長期/MCP対応）	○ LangChain統合等	Memory体系＋MCP接続が整備
	MetaGPT	◎（SOP/チーム型）	△（セッション中心）	○ 開発特化	継続更新、MGX発表
クラウド	IBM watsonx Orchestrate	◎（Collaborator agents）	◎ マルチターン＋外部KB	◎ 業務アプリ接続＋Agent Connect	外部エージェント統合が進展
	AWS Bedrock Agents	◎（マルチエージェント協調 GA）	○（Agent Memory）	◎（Action groups, Code Interpreter, MCP Gateway）	AgentCore群で運用性強化
	Azure AI Foundry Agent Service	◎（Connected agents）	○（Threads/Storage）	◎ Function Calling, Browser Automation, MCP	2025/5 GA、VS Code統合
	Google Vertex AI Agents	◎（Agent2Agent＋ADK）	◎（Memory bank）	◎ Search/Maps/コネクタ＋MCP	クロスベンダー連携を推進

参考資料

手法・理論

Yao et al., 2022. ReAct: Synergizing Reasoning and Acting in Language Models arXiv:2210.03629
Schick et al., 2023. Toolformer arXiv:2302.04761
Shinn et al., 2023. Reflexion arXiv:2303.11366
Masterman et al., 2024. Survey on AI Agent Architectures arXiv:2404.11584
Survey: The Rise and Potential of LLM-based Agents arXiv:2309.07864

プロトコル

MCP (Model Context Protocol) https://modelcontextprotocol.io
Agent2Agent (Google) Google Cloud Blog

OSS

クラウド

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up