みなさん、こんにちは。
日本マイクロソフトの佐々木です。
前回はCopilot Studioのクラシックオーケストレーションモードと生成オーケストレーションモードの概要について紹介させていただきました。
この記事は実装編ということで実際に作成していきたいと思います。
生成オーケストレーションモードのエージェントの開発は全く新しい開発のフレームワークになると思います。柔軟な対話を実現するための思考が求められると思います
こちらは下記の記事の続きとなります。
生成オーケストレーションモードのエージェントとは
生成オーケストレーションモード:最適なアクション、ナレッジ、トピック を選択し、ユーザーのクエリに回答したりすることができるエージェントとなります。
また、エージェントにトリガーを追加することで、イベントトリガーに応答できる自律型エージェントを開発することができます。
生成オーケストレーションモードのエージェントを作成してみる
では実際に実画面で説明していきたいと思います。
今回のエージェントでは、店舗の一般的な問合せに応対しつつ、予約対応をするようなエージェントを作成します。
手順1_エージェントを作成する
基本的な初期設定は通常のクラシックオーケストレーションモードのエージェントの作成方法と同一ですので、割愛します。
指示や説明は、ここでは空白で問題ないです。
2025年3月現在、言語が英語のエージェントのみ生成オーケストレーションモードのエージェントをサポートしています。
手順2_生成オーケストレーションモードを有効にする
エージェントの設定より、生成オーケストレーションモードを有効にします。
有効にすると、概要ページのオーケストレーションも同様に有効になります。
手順3_指示や説明を記載する
生成オーケストレーションモードのエージェント(自律型エージェントも同様)を開発する場合、説明や指示が非常に重要になります。
ここの説明や指示を自然言語でわかりやすく記載していきます。
例えば、今回のエージェントの場合、
ナレッジの検索:ユーザーからの一般的な質問に答える
アクション:ユーザーからの予約に対応する
など、それぞれどういったケースでどういった対応が必要なのかを明記していきます。
手順4_ナレッジを構成する
利用するナレッジを構成します。
今回は店舗情報が格納されたDataverseテーブルと営業時間が格納されたWordファイルを利用します。
Wordにはちょっとした意地悪をします。
ナレッジが追加されたら、[編集]をクリックし、重要な作業をします。
それぞれのナレッジの説明を入力します。
生成オーケストレーションモードのエージェントは、ユーザーの入力内容に回答するため、積極的にナレッジを検索します。そのため、どういったナレッジなのかを説明します。
このナレッジ ソースは 店舗営業時間.docx に含まれる情報を検索します。
店舗に関する基本的な情報(営業時間)が格納されており、
ユーザーからの店舗に関する質問に対して、こちらのナレッジを用いて回答を生成します。
手順5_アクションを構成する
つづいてアクションを構成していきますが、今回はPower Automate のクラウドフローを作成します。
フローの中身はこういった形式にします。
エージェント側から入力パラメーターを受けて、Dataverseの予約テーブルにレコードを追加するフローとなります。
ここからも重要な作業があります。それは、アクションの詳細の説明や入力パラメーターの説明の追加です。
生成オーケストレーションモードのエージェントから実行されるアクションのパラメーターは、エージェントが自動的に対話形式や会話履歴から補完していきます。そのため、アクションの実行タイミングや入力パラメーターの説明が重要となります。
ユーザーから来店予約の依頼があった場合に実行されます。
ユーザーから明確に来店予約をしたい意思があった場合、
[来店予約対応]アクションを実行します。必要な情報をユーザーに質問し、入力情報を補完してください。
応答は日本語で対応する必要があります。
手順6_トピックを構成する
ここまできたら基本的には最適なナレッジ検索やアクションを動的に選択し、最適な応答を自動生成するエージェントは構成できているはずです。
仕上げとして、トピックも構成していきます。
今回はエージェントがナレッジ検索をしたいけれども抽象的な質問があった場合にもう少し深堀するためのサンプルトピックを作成します。あくまでトピックがどのように生成オーケストレーションモードで呼び出しされるかをテストする目的で構成します。
生成オーケストレーションモードのトピック場合、初期設定は[エージェントによりトリガーされる]というトリガーで作成されますので、ここにも説明を追加します。
店舗に関する質問 について、具体的な質問内容を補完するために、ユーザーに尋ねるためのトピックです。
ユーザーからの入力内容や質問が「店舗に関する質問」 など具体性に欠ける場合のみで呼び出されます。
具体的な質問内容が既に入力されている場合やナレッジから回答が生成された場合にはこちらのトピックは利用しません。
本トピック内で評価するための入力変数も設定しておきます。
こちらの変数の値も生成オーケストレーションモードで動的に作成されます。
手順7_テストする
ここまできたらいったん構成は完了です。それではテストしたいと思います。
テスト実行した場合、クラシックオーケストレーションモードにはなかった[活動マップ]というUIで思考の過程が確認できます。
具体的な質問があり、ナレッジ検索を積極的に利用されるケース
イメージ通り、ナレッジ検索をおこない、正しい回答が得られました。
そのまま来店予約の依頼があるケース
このまま来店予約をしたかったのですが、入力補完が失敗しています。
このあたりは指示の書き方や日本語対応が待たれます。
改めて来店予約してみる
気を取り直して、新しいセッションで来店予約します。
来店予約をしたい旨を伝えると、なぜかナレッジ検索をした(積極的に検索する仕様のため)あとアクションが自動で呼び出されました。
加えて、入力パラメーターを補完するかたちで自動的に質問してきます。
あれこれ質問してきて、アクションが完了しました。いったんは成功です。
あいまいな質問があり、トピックを呼び出されるケース
参考として作成したトピックが呼び出しされるか確認します。
具体的な質問が欠けていると評価されたため、トピックが呼び出しされました。
おわりに
以上で生成オーケストレーションモードのエージェントの作成について説明させていただきました。
基本的にはこのエージェントに自律型トリガーを作成すると自律型エージェントになります。
例えば、トリガーはOutlookメールなどにして、メールにも反応できるようにしてもいいです。
あたらしい開発手法のため馴染みづらい側面もあると思いますが、非常にわくわくするエージェント開発となります。柔軟な対応が必要なケースなどに向いているでしょう。