はじめに
この記事では AIエージェントとは何か、そしてAIエージェント関連の
- プロトコル
- フレームワーク
- コーディングエージェント
について、最新動向をもとに全体像を整理します。
※利用方法や詳細な実装は割愛しています。
AIエージェントの定義
AIエージェントとは一般的に自律的に判断し、ツールや他のAIと連携してタスクを実行するAIシステム
を指します。
AnthropicはAIエージェントを「長期間独立して動作し、ツールを利用して複雑なタスクを遂行する自律システム」
と定義し、WorkflowとAgentを明確に区別しています。
わかりやすく言うと
Workflow → 人間が設計した処理
Agent → AIが判断する処理
です。
AIエージェントの全体地図
AIエージェントのは現在以下のようなレイヤーで構成されています。
このようにAIエージェントは
- LLM
- ツール
- フレームワーク
- プロトコル
- アプリケーション
など複数のレイヤーで構成されています。
プロトコル
AIエージェントではツールや他のエージェントと連携するためのプロトコルがあります。
MCP(Model Context Protocol)
AIエージェントとツールを接続するためのプロトコル。
例
- データベース
- API
- ファイル
- SaaS
- GitHub
- Slack
などを共通のインターフェースで接続できる。
Agent
↓
MCP
↓
Tool / API / DB
A2A(Agent-to-Agent)
AIエージェント同士の通信を標準化するプロトコル。
主な用途
- エージェント間通信
- タスク委譲
- マルチエージェント連携
Agent A
↓
A2A
↓
Agent B
ANP(Agent Network Protocol)
大規模なエージェントネットワークを想定した研究プロトコル。
まだ実運用の標準ではありませんが将来的な Agentic Web (AIエージェント駆動の次世代Webの概念)の基盤として研究が進められています。
フレームワーク
AIエージェントを開発するためのフレームワークも多数登場しています。
LangChain
Model / Prompt / Indexing / Chain / Tool / Memory / Agent
などの機能で構成されるLLMアプリケーションフレームワーク。
比較的ワークフロー寄りの設計です。
LangGraph
LangChainの拡張フレームワーク。
特徴
- State Graph
- 条件分岐
- ループ
- 状態管理
エージェントの制御に強い設計になっています。
AutoGen(Microsoft)
会話駆動のマルチエージェントフレームワーク。
複数のエージェントが対話しながらタスクを解決する仕組みを構築できます。
CrewAI
役割ベースのエージェントフレームワーク。
Role
Task
Process
の3つで構成され、人間組織に近いモデルになっています。
Semantic Kernel(Microsoft)
MicrosoftのAIアプリケーションフレームワーク。
特徴
- Planner
- Memory
- Tool
などの機能を提供します。Microsoft Researchが開発したマルチエージェントフレームワークです。
複数のAIエージェントが会話を通して協力しながらタスクを解決する仕組みを簡単に構築できます。
AutoGPT
完全自律型AIエージェントの代表的プロジェクトです。
ユーザーが与えた目標をもとに
AIが自律的にタスクを分解し実行します。
下記の基本ループで動作します。
Goal
↓
Plan
↓
Execute
↓
Evaluate
↓
Repeat
PydanticAI
PythonベースのAIエージェントフレームワーク。
Pydanticを活用した型安全なエージェント構築が特徴です。
フレームワークの利用例
| フレームワーク | 分類 | 利用例(具体例) |
|---|---|---|
| LangChain | LLMアプリ | 社内ドキュメントを検索して回答するRAGチャット |
| LangGraph | エージェント制御 | コード生成 → テスト → エラーなら再生成する開発エージェント |
| AutoGen | マルチエージェント | 調査AI → 分析AI → レポートAIが協力して市場分析 |
| CrewAI | 役割分担エージェント | Researcher / Writer / Editor のAIチームで記事作成 |
| Semantic Kernel | 企業システム連携 | AIがCRM・ERPを操作して営業レポート作成 |
| AutoGPT | 自律エージェント | 「競合調査してレポート作成」をAIが自動実行 |
| PydanticAI | 型安全なAIエージェント | 構造化データ(JSON)を厳密なスキーマで生成するAI API |
コーディングエージェント
毛色が少し変わりますが、最近話題のコーディングエージェントについても簡単にまとめておきます。
コーディングエージェントは現在、大きく2種類のタイプに分類でき
IDE型(コード補完が中心)、エージェント型(AIが開発を自律的に行う)がある認識です。
どのタイプに分類されるかと特徴を下記の表にまとめました。
| コーディングエージェント | タイプ | 特徴 |
|---|---|---|
| GitHub Copilot | IDE型 | VSCodeなどのIDEと統合された定番AI補完ツール。コード補完と開発効率化に強い |
| Cursor | IDE型 | AIネイティブIDE。コード生成・修正・リファクタリングをIDE内で自然に行える |
| Cline | エージェント型 | VSCode拡張型エージェント。LLMがコード編集・実行・デバッグまで自律的に行う |
| Codex | エージェント型 | OpenAIのコード特化モデル。自然言語からコード生成が可能 |
| Claude Code | エージェント型 | 大規模コードベース理解に強い。設計レベルのコード修正やレビューが得意 |
| Kiro | エージェント型 | 要件定義、実装→テスト→修正の開発フローを段階的に実行できる |
| Antigravity | エージェント型 | 要件から実装・修正まで自動化を目指す開発エージェント |
| Devin | エージェント型 | 設計・実装・テストまで自動実行するAIソフトウェアエンジニア |
まとめ
ここまで読んでいただきありがとうございます。
AIエージェントの進化はとても早いため、この記事の内容もすぐに古いものになる可能性があります。
その際は、都度気づいたときに更新していきたいと思います。
皆さんもぜひAIを使うだけでなく、中身の技術も確認しながらその進化を追ってみてください。
参考にした記事
https://www.anthropic.com/engineering/building-effective-agents
https://zenn.dev/dxclab/articles/bf1ee43f9b7a0c