概要
2024年頃から生成AIを使った、半自立的に動くエージェントシステムが現れており、パッと思いつくものではDevin, Manusなどがあり、最近でもChatGPTにエージェントモードが機能として追加されるなど、エージェントを名乗るサービスが提供されております。
また「2025年度はエージェント元年」という言葉が技術イベントなどでも聞かれ、生成AIサービスを作るうえでエージェントは無視できない用語になっていると感じます。
(ただ「エージェント元年」という言葉、誰が最初に言ったのか自分は分かっておりません。リサーチしてみても、これというのが見つからず)。
それに伴って、エージェントに関連する言葉も複数現れるようになったと思っております。
自分の周りでは、AIエージェント、エージェント型AI (Agentic AI)、マルチエージェントという言葉をよく聞きます。
しかし、これらの言葉を整理しようと調べているうちに、企業・話し手によって言葉や定義が曖昧だと思うようになり、個人的には整理が必要だと感じました。
ここでは、AIエージェント、エージェント型AI、マルチエージェントの定義について、各社や話し手がどのように述べているのかを整理し、その上で自分の解釈をまとめてみました。
飽くまでも参考程度にして頂けると幸いです。
AIエージェント
この言葉については、IPAの技術コラム で各社どのように定義しているのかをまとめてくれています。
企業・団体 | AIエージェントの定義 |
---|---|
OpenAI | ユーザーの代わりにタスクを自律的に実行するシステムであると捉えています。 |
AI を使用してユーザーの代わりに目標を追求し、タスクを完了させるソフトウェアシステムです。 | |
Gartner | デジタルおよび現実の環境で、状況を認識し、意思決定を下し、アクションを起こし、目的を達成するために AI 技術を適用する、自律的または半自律的なソフトウェア。 |
一般社団法人 AICX 協会 | 自律的に判断・行動し、特定の目的に向けて人間をサポートする知的なソフトウェアシステム。 |
IPAでは一般的には「ユーザーから与えられた指示に基づき、自律的に問題解決やタスク実行を行うソフトウェア」と言われている、と記載しております。
上記で書かれている定義で共通している点としては、「自律性」でしょうか。
Gartnerでは、AIエージェントの特性を以下のようにまとめております。
能力 | 説明 |
---|---|
適応性 | エージェントが、自身の環境や目的の変化に応じて、その振る舞いや戦略を調整できる能力 |
積極性 | エージェントが、将来のシナリオを予測し、戦略的な意思決定を下し、目的達成のために自らアクションを起こせる能力 |
目的の複雑性 | エージェントが、高度な意思決定と問題解決の能力が必要な、相互に関連する複数の目的達成に求められるタスクを管理し、実行できる能力 |
環境の複雑性 | 高度な不確実性、変動性、複雑性を伴う環境で、エージェントがタスクを制御し、実行できる能力 |
自律性 | ほとんどまたはまったく人間の介入なしで、エージェントがどこまで独立して稼働できる能力 |
少なくとも、ユーザーの介入がほとんど無く自律的にタスクを実行するAIのソフトウェア、が各社のAIエージェントの定義で共通している部分と考えられます。
エージェント型AI (Agentic AI) とエージェントAIの違い
次にエージェント型AIの定義について考えてみたいと思います。
こちらもGartner が定義しているので、引用します。
用語 | 定義 |
---|---|
AIエージェント | デジタルおよびリアルの環境で、状況を知覚し、意思決定を下し、アクションを起こし、目的を達成するためにAI技法を適用する自律的または半自律的なソフトウェア |
エージェント型AI | 組織のために行動し、自律的に意思決定を下してアクションを起こすために、組織に代わって行動する権利を付与された目標主導型のソフトウェア・エンティティ。記憶、計画、センシング、ツール利用、ガードレールなどのコンポーネントと共にAI手法を使用して、タスクを完了し、目標を達成する |
個人的には違いが今ひとつ分かっていないです。
ただ何となく、エージェント型AIはAIエージェントよりもより複雑なシステムで、複雑なタスクが出来るようになったソフトウェア、なのかなと思いました。
読み取れた違いとしては、以下の3つになります。
- AIエージェントは半自律性も認めているが、エージェント型AIは自律性のみ
- エージェント型AIは組織という大きな対象のタスクを実行する
- エージェント型AIには、記憶・計画・ツール利用などのコンポーネントを利用する
ただこれだけでは違いを理解するのは難しい、と判断し以下の文献を読みました。
AI Agents vs. Agentic AI: A Conceptual
Taxonomy, Applications and Challenges
この文献ではAIエージェントとエージェント型AIの違いを説明しているのですが、幾つか表や図を引用します。
表1引用
特徴 | AIエージェント | Agentic AI |
---|---|---|
定義 | 特定のタスクを実行する自律的ソフトウェアプログラム | 複数のAIエージェントが協調して複雑な目標を達成するシステム |
自律性レベル | 特定タスク内での高い自律性 | 複数ステップ・複雑なタスクやシステムを管理できる広範な自律性 |
タスクの複雑さ | 単一かつ特定のタスクを処理 | 協調を要する複雑で多段階のタスクを処理 |
協調性 | 独立して動作 | マルチエージェント間での情報共有・協調・協力を伴う |
学習と適応 | 特定領域内での学習・適応 | より広範なタスクや環境にわたり学習・適応 |
応用例 | カスタマーサービスチャットボット、バーチャルアシスタント、自動化ワークフロー | サプライチェーン管理、業務プロセス最適化、バーチャルプロジェクトマネージャー |
表4 一部抜粋
特徴 (Feature) | AIエージェント (AI Agent) | Agentic AI |
---|---|---|
中核機能 (Core Function) | タスク特化の実行 (Task-specific execution using tools) | 複雑なワークフロー自動化 (Complex workflow automation) |
メカニズム (Mechanism) | プロンプト → ツール呼び出し → LLM → 出力 | ゴール → エージェントのオーケストレーション → 出力 |
構造 (Structure) | LLM + ツール | マルチエージェントシステム (Multi-agent system) |
外部データアクセス (External Data Access) | 外部API経由 (Via external APIs) | 協調的なマルチエージェントアクセス (Coordinated multi-agent access) |
主要特性 (Key Trait) | ツール利用 (Tool-use) | 協調 (Collaboration) |
これらの内容から、以下のように解釈しました。
-
AIエージェント:単一のタスクを半自律的・自律的に行う単一のAIソフトウェア。
- 単一のタスクというのは「(スライドを作るための)情報収集」みたいな何かしらの大きな目的を達成するための一つのタスク。
- 必要があればツール呼び出しも行う。
-
エージェント型AI:オーケストレーターとなるエージェントが計画を立てて、複数のAIエージェントを協働しながら、より複雑なタスクを行うマルチエージェントのソフトウェア。
- 「スライドを作る」というように幾つかのタスクが必要なものを行う
- 複数のエージェントとのやり取りを想定している
- 計画・サブタスクを行うエージェントによって、各タスクを行う専門のエージェントを呼び出し、それらとやり取りしながらAIエージェントではできないタスクを実現する
- 過去のやり取りなどはメモリと呼ばれる記憶媒体に入れておき、文脈を考慮しながらタスクを解く。
ただこの解釈も正しいとは言えず、ある技術イベントで某社の発表では、上記のエージェント型AIの定義を、AIエージェントと呼んでいました。
具体的には、今までの生成AIシステムは小さなタスクを実行 (情報収集など) していたのを、それらをエージェントを組み合わせて複雑なタスク (スライド作り) も出来るようになり、それをAIエージェント と仰っておりました。
恐らく、単一のタスクというのが人によって捉え方が違いによって、用語の定義のバラツキが今後も起こるのでは、という懸念があります。
自分もタスクの最小単位とは?と問われると、現状上手く説明できません。
マルチエージェントとエージェント型AIの違い
これらの用語の違いも頭を悩ませました。
マルチエージェントの定義は、Google Cloudから引用します。個人的にもこのように解釈していました。
- マルチエージェント: 共通の目標または個々の目標を達成するために、複数の AI エージェントが協力または競合します。これらのシステムは、個々のエージェントの多様な機能と役割を活用して、複雑なタスクに取り組みます。
エージェント型AIを調べたときに、正直マルチエージェントとの違いがわかりませんでした。
どちらも複数のAIエージェントと連携しているじゃん、って思っておりました。
その後、マルチエージェントとエージェント型AIの違いを調べていたのですが、それらの違いに触れている文章は見当たらず。そのため今も定義の違いは分かっていません。
ただ何度もGoogleのマルチエージェントの定義と、AI Agents vs. Agentic AI: A Conceptual
Taxonomy, Applications and Challengesを読んでいると、以下の違いに気づきました。
- マルチエージェント:飽くまでも複数のAIエージェントが連携することしか述べていない
- エージェント型AI:オーケストレータとなるエージェントが計画を立てて、複数のAIエージェントと協働することを強調
例えば、あるエージェントが出力したものを別のエージェントがレビューする、というのはマルチエージェントではありますが、エージェント型AIかと言われると微妙です。
ユーザーの指示 → Aが情報収集 → BがAの出力を確認、というワークフローに計画やタスクの細分化などはしていません。
飽くまでもAIエージェントのタスクに、追加で出力のレビューが入っただけに過ぎないと考えられます。
つまりエージェント型AIというのは、マルチエージェントの1つであり、目的に対してオーケストレータが計画・タスクの細分化を行い、その目的を達成するための各タスクを行うエージェント達とやり取りするマルチエージェントシステム、と解釈しました。
ただ、正直ここらの違いはbig tech等が上手く定義してほしいな、という気がしています。
まとめ
上記の内容をまとめ、最終的な個人の解釈は以下の通りになります。
用語 | 本記事での解釈 |
---|---|
AIエージェント | 単一のタスクを行う自律的・半自律的な1つのAIソフトウェア |
マルチエージェント | 複数のAIエージェントが協働し、AIエージェント単独ではできない複雑なタスクを行うソフトウェア |
エージェント型AI | マルチエージェントの一種。オーケストレータとなるエージェントが目的に基づき計画やタスクの細分化を行い、各タスクに適切なAIエージェントとやり取りして複雑なタスクを遂行するマルチエージェントシステム |
個人的にはとにかく動けば問題ないだろう、とも思います。
ただ一方で、情報収集ややり取りをする際に、企業や話し手が何を表しているのかと意識するのはコミュニケーションにおいて必要だと思うので調べて、記事にしてみました。
飽くまでも個人の解釈ではあるので、これだけの用語があり人や企業によって定義のバラツキがあるのか、というのが伝われば良いかなと思っています。