「生成AI」の次にブレークスルーになるのは「AIエージェント」
ここ数か月、「AIエージェント」という言葉が一気にブームになってきているように思います。
RAGが一巡したこともあり、「RAGの次はAIエージェント」、もっと言うと、「生成AIの次はAIエージェント」という声さえ聞こえてきています。
OpenAIのサム・アルトマンCEOが、「次の大きなブレークスルーはエージェントだ」と発言していることからも、その流れは既定路線なのでしょう。
https://www.reddit.com/r/ChatGPT/comments/1ggixzy/comment/luqgr7l/?rdt=62265
でも、みなさん、「AIエージェント」の定義を説明できますか?
というか、話す人によって定義が揺れすぎだと思いませんか?
ということで、真面目に大手各社のAIエージェントの定義を調べてみました。
各社のAIエージェントの定義
各社のAIエージェントの定義について抜き出してみました。
まずは、機能としての定義というより、各社のAIエージェントの向き合い方的なコメントを抜粋しています。
ベンダ | AIエージェント定義 | 備考 |
---|---|---|
OpenAI | AIエージェントが単にアシスタントになるだけでなく、近く人と対話、連携し、さらには感情を持つようになる未来を描いています。 | OpenAIは、本日時点ではAIエージェントの公式サービスを提供していないため、公式の定義を見つけられず。連携するAltera社を紹介する公式ページより抜粋。https://openai.com/ja-JP/index/altera/ |
あなたの周りの世界についてより深く理解し、何歩も先を考え、あなたの監督の下であなたに代わって行動を起こすことができます。 | Gemini 2.0公表時のGoogle CEO Sundar Pichaiブログより https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ceo-message | |
Microsoft | エージェントとは何かを考える時、具体的な権限と役割を持ったチームメートと捉えることが望ましい。私たちも同じように、権限と役割を与えられて仕事をしているはず。エージェントもそれと同じ | Ignite 2024にてナデラCEOが発表 https://www.lifehacker.jp/article/2412-microsoft-is-introducing-new-ai-agents-in-office/ |
AWS | 人工知能 (AI) エージェントは、環境と対話し、データを収集し、そのデータを使用して自己決定タスクを実行して、事前に決められた目標を達成するためのソフトウェアプログラムです。目標は人間が設定しますが、その目標を達成するために実行する必要がある最適なアクションは AI エージェントが独自に選択します。 | AWSは「What-is-AIagent」のページを用意しているくらい力を入れています。https://aws.amazon.com/jp/what-is/ai-agents/ |
Databricks | ハードコードされたロジックとは対照的に、モデルが計画決定の一部またはすべてを行うAIシステムとして理解されています。これらのエージェントは、大規模言語モデル (LLM) を使用して意思決定を行い、目的を達成します。 | Databricksは唯一、「複合AIシステム」との比較で定義されています。https://docs.databricks.com/ja/generative-ai/agent-framework/ai-agents.html |
Salesforce | 自律型AIエージェントは、人間による細かなサポートをほとんど必要とせず、高度な計画、推論、調整を実行できます。 | こちらも公式で定義ページがありますが、ボットとの対比で定義する形はSalesforceならではですね。https://www.salesforce.com/jp/news/stories/rise-of-agentic-systems/ |
OpenAI、Microsoft、Google、AWS、Databricks、Salesforceの大手6社のAIエージェントの定義を調べてみました。
OpenAI・Googleが人間との対話・監督によって活動する人間協調自律AI派、AWS・Salesforceが人間の介入なしに動作する独立自律AI派、Microsoft・Databricksはその中間のお仕事推進自律AI派、ってところでしょうか。
人間の介入を前提とするか否かでスタートが変わると思うのですが、揺れてますねぇ。
ただ、本気で向き合ってみたので、少し理解が深まった気はします。
各社のAIエージェント関連サービス
では、続いて、各社がその定義に則り、どのようなサービスを展開されているのかを見ていきましょう。(2024/12/17時点)
ベンダ | AIエージェント関連機能 | 機能概要 |
---|---|---|
OpenAI | コードネーム:Operator(swarmは実験コードなので除外) | リリース前なので詳細不明 https://www.gizmodo.jp/2024/11/openai-agent.html |
Vertex AI agent builder | 使いやすいノーコード エージェント ビルダー インターフェースを選択して、自然言語を使用してエージェントを構築できます。また、Vertex AI の LangChain などの強力なオーケストレーション機能とカスタマイズ機能を使用できます。 https://cloud.google.com/products/agent-builder | |
Microsoft | Copilot agents in Microsoft 365 Copilot | Microsoft Copilot Studio は、Copilot エージェントを作成、管理、デプロイするための包括的なプラットフォームを提供。自然言語を使用して Copilot エージェントに何をさせたいかを Copilot Studio に指示し、特定のドキュメントやデータベース全体など、組織のデータ全体から統合するナレッジソースを簡単に選択できます。 https://www.microsoft.com/en-us/microsoft-copilot/blog/copilot-studio/unveiling-copilot-agents-built-with-microsoft-copilot-studio-to-supercharge-your-business/ |
AWS | Amazon Bedrock Agents | ジェネレーティブ AI アプリケーションが企業システムやデータソース全体で多段階タスクを実行できるようにします。 https://aws.amazon.com/jp/bedrock/agents/ |
Databricks | Mosaic AI エージェントフレームワーク | 開発者が任意のLLMを通じてプロダクション規模のエージェントシステムを構築することを可能にし、カスタマイズを可能にし、エージェントが自律的な決定を下すことを強化します。 https://www.databricks.com/jp/blog/build-autonomous-ai-assistant-mosaic-ai-agent-framework |
Salesforce | Agentforce | AgentforceのAIエージェントによる制限の無いデジタルワークフォースは、データの分析、意思決定、顧客サービスに関する問い合わせへの回答や見込み顧客の選別、マーケティングキャンペーンの最適化などのタスクに対して行動を起こすことができます。 https://www.salesforce.com/jp/news/press-releases/2024/09/13/agentforce-announcement/ |
基本的には、各社とも、
- 自然言語を入力として動作するAIエージェントを構築する(BedrockやAgentforceは自然言語入力なしでも動くかも)
- AIエージェントは、当該ベンダが提供する種種の機能を組み合わせてタスクを遂行する
というサービスで揃っているかとは思います。
Googleが、エージェント自体も自然言語で構築できそうなので、一歩革新的でしょうか。
機能はどれも似た形ですが、Databricksのみ、しっかりと概念図を描いてくれていました。
このイメージはとてもしっくりくるので、個人的には、システム的なAIエージェントの定義はこの絵で良いのではないかと考えている次第です。
https://www.databricks.com/jp/blog/build-autonomous-ai-assistant-mosaic-ai-agent-framework
まとめ
各社とも、アーキテクチャは似ていますが、「人間と対話して進める」or「目標に向かって自律する」で基本方針が異なった結果、サービスとしては同じAIエージェントって言葉でも揺れているところかと感じました。
その一方で、AIエージェントの一歩先、「マルチエージェント」関連のサービスを提供し始めているベンダもあり、やはり、AIエージェントのフェーズになってもスピード勝負な状況は変わらない印象ではあります。
マルチエージェントももう少し根付いたところで、製品の棚卸はしたいと思います。