この記事について
AIエージェントが業務の自動化や効率化で注目を集めており、AIエージェントを構築するためのフレームワークや周辺技術が勃興しています。この記事では、AIエージェントを構築するのに役立つフレームワークについてまとめてみました。
- AIエージェントとは何か?(Introduction)
- AIエージェントを作るのに何が必要か?(デザインパターン)
- AIエージェントを構築できるサービス・フレームワーク
AIエージェントとは何か?
大手各社のAIエージェントの定義をまとめたものが以下の通りです。
”AIエージェント”というものについて統一的な定義はなされていないようです。
しかし、この後出てくる「AIエージェントを作るのに何が必要か?」という問いの答えが垣間見えます。
- OpenAI
- AIエージェントが単にアシスタントになるだけでなく、近く人と対話、連携し、さらには感情を持つようになる未来を描いています
- Google
- あなたの周りの世界についてより深く理解し、何歩も先を考え、あなたの監督の下であなたに代わって行動を起こすことができます
- Microsoft
- エージェントとは何かを考える時、具体的な権限と役割を持ったチームメートと捉えることが望ましい。私たちも同じように、権限と役割を与えられて仕事をしているはず。エージェントもそれと同じ
- Amazon
- 人工知能 (AI) エージェントは、環境と対話し、データを収集し、そのデータを使用して自己決定タスクを実行して、事前に決められた目標を達成するためのソフトウェアプログラムです。目標は人間が設定しますが、その目標を達成するために実行する必要がある最適なアクションは AI エージェントが独自に選択します
- Databricks
- ハードコードされたロジックとは対照的に、モデルが計画決定の一部またはすべてを行うAIシステムとして理解されています。これらのエージェントは、大規模言語モデル (LLM) を使用して意思決定を行い、目的を達成します
- Salesforce
- 自律型AIエージェントは、人間による細かなサポートをほとんど必要とせず、高度な計画、推論、調整を実行できます
参考リンク:「AIエージェント」の定義揺れすぎ問題に向き合ってみた【大手ベンダ6社調査】
AIエージェントを作るのに必要なもの
既にAIエージェントのデザインパターンがいくつも提案されています。
それらパターンの特徴や共通点を整理することで、AIエージェントを形作るのに必要な要素を洗い出してみました。
- User
- AIエージェントが問題解決するプロセスの中に人が介在することを示しています。例えば、Human in The Loopと呼ばれるデザインパターンでは、適宜ユーザのチェックを経て、回答精度を向上させる提案がなされています。
- Agent
- AIエージェントそのものです。実態としては大規模言語モデル(LLM)で、LLMモデルの選定がAIエージェントの精度に直結するといっても過言ではありません。LLM同士を対話させたり、継続的にLLMモデルを学習させる提案がなされています。
- Memory
- 人とエージェントとの会話を記憶するための記憶領域です。過去のやり取りを保持しておくことで段階的にユーザの望む回答にブラッシュアップすることができます。
- Tools
- LLMが持たない知識や能力を補うための外部ツールです。例えば、DBや検索エンジンと連携することで蓄積された業務上のノウハウにアクセスできたり、最新情報をwebから収集してくることができます。
参考サイト
AIエージェントを構築できるサービス・OSS
実際にAIエージェントを構築するのに役立つサービスやOSSを調べて一覧にしてみました。
Pythonなどでプログラミングしなくても、UI操作で簡単にAIエージェントを構築することができます。SaaS以外にもOSSでセルフホストできる仕組みも存在するため、手軽にお試しすることができます。
AIエージェントの登場で何がどう変わるか?
従来はLLMも与えられたデータ(テキストや画像など、時としてはマルチモーダルな入力)を要約したり、説明するといった目的で呼び出される一つのツールとしての役割を担ってきましたが、AIエージェントの登場によって、外部ツールなどを利用することでより高度なタスクを自律的に処理できるようになります。