More than 1 year has passed since last update.

Amazon Q in Connectで「コンテンツ検索」と「リアルタイムレコメンデーション」を試してみた

Posted at 2024-06-02

はじめに

Amazon Connect はAWSが提供するクラウドベースのコンタクトセンターサービスです。
2017年にローンチして、2018年には東京リージョンでも利用できるようになりました。
私も過去に記事を書いています。

一方、Amazon Q はAWSで使えるAIアシスタント（チャットボット）で2023年11月に登場したばかりのサービスです。
マネージメントコンソールからも利用することができ、チャット形式で質問することが可能です。
ただし、2024年5月時点で日本語対応はしていません。

今回扱う Amazon Q in Connect は、名前の通りAmazon ConnectでAmazon Qを使えるサービスになります

この記事ではAmazon Q in Connectの環境を構築して、「コンテンツ検索」 と 「リアルタイムレコメンデーション」 を試してみます。

Amazon Q in Connectの活用シーン

Amazon ConnectとAmazon Qの組み合わせがなぜ効果的かを説明します。

コンタクトセンターのオペレータは様々な問い合わせに対応します。
コンタクトセンターに問い合わせて「少々お待ち下さい」と、電話を保留にされた経験は誰しもがあると思いますが、その時はオペレータがマニュアルを探して調べたり、詳しい人にエスカレーションして質問したりしています。

オペレータがAmazon Q in Connectを活用すれば、AIが返答してくれるため、マニュアルを探したり、エスカレーションしたりする時間を大幅に削減することできます。

Amazon Q in Connectは情報ソースとして以下を利用できます。

S3バケット
Salesforce
Zendesk
ServiceNow
SharePoint

ハンズオン（環境をつくる）

ここからはハンズオン形式で紹介します。
Amazon Q in Connectは東京リージョンでも利用できますので、東京リージョンでやっていきます

Amazon Connectインスタンスの作成

まずはAmazon Connectのインスタンスを作ります。
下記の画面から任意のアクセスURLをつけて作成します。

今回は「管理者なし」、他もデフォルト設定で進めます

KMSキーの作成

キーのタイプを「対象」にして任意の名前をつけます

作成後に、Amazon Q in Connect ドメインのキーポリシーで、次のアクセス許可をconnect.amazonaws.com サービスプリンシパルに付与します

kms:GenerateDataKey*
kms:DescribeKey
kms:Decrypt

以下が参考となるJSONです。

{
    "Id": "key-consolepolicy-3",
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::your_accountId:root"
            },
            "Action": "kms:*",
            "Resource": "*"
        },
        {
            "Effect": "Allow",
            "Principal": {
                "Service": "connect.amazonaws.com"
            },
            "Action": [
                "kms:Decrypt",
                "kms:GenerateDataKey*",
                "kms:DescribeKey"
            ],
            "Resource": "*"
        }
    ]
}

コンテンツ格納用のS3バケットの作成

マニュアルなど、コンテンツ格納用のS3バケットを作成します。
こちらも任意のバケット名をつけます。暗号化タイプはここではデフォルトの「Amazon S3 マネージドキーを使用したサーバー側の暗号化 (SSE-S3)」とします

Amazon Qのドメイン追加

Amazon Connectのインスタンスでドメインの追加を行います。任意のドメイン名を付けて、ここでは暗号化設定のカスタマイズのチェックボックスはOFFにします。

ドメインの統合

ドメインを追加したら統合設定を行います。
ここではソースはS3を指定し、任意の統合名を付けます。
さきほど作成したS3バケットとKMSキーを指定します。

S3へのコンテンツのアップロード

S3バケットにコンテンツとなるマニュアルをアップロードします。
なおAmazon Q in Connectで検索対象とできるファイルは 管理者ガイド に書かれている4種類です。

HTML ファイル
Word ファイル
PDF ファイル
テキストファイル

また、ファイルのサイズは1MB以下 であることが必要です。はじめはこの仕様に気づいておらずハマりました
冒頭にも触れましたが、まだ日本語対応していないので試す場合は英語のファイルにしましょう。

ここでは例として、テスラモデル3の操作マニュアル のPDFをダウンロードして、これをS3にアップロードします。

※なお、マニュアルが292ページ、ファイルサイズが約8MBあったため、1ファイルあたり1MB以下になるようファイルを20個に分割しました

コンテンツの検索を試す

これはAmazon Qのチャット画面から自然な文章でコンテンツを検索する機能です。
公式ドキュメントは こちら です

Amazon ConnectのエージェントWorkspaceの起動

ここでAmazon Connectのインスタンスの管理画面に入り、エージェントWorkspace（≒オペレータが受電するときに使う画面）を起動します

ここで右側にAmazon Qとのチャットボックスが出てきます

Amazon Q in Connectに聞いてみる

Amazon Q in Connectに対して、
"What can I do with the touch screen?"（タッチスクリーンで何ができますか？）
と聞いてみます。

ちゃんとさきほど格納したPDFファイルを参照した上で、

"The touch screen in the vehicle can be used to control navigation, view maps, check vehicle status and messages, adjust climate controls, and access entertainment features like media."
（車内のタッチスクリーンを使用して、ナビゲーションの制御、地図の表示、車両のステータスとメッセージの確認、空調制御の調整、メディアなどのエンターテイメント機能へのアクセスを行うことができます。）
と回答が返ってきました。回答としては正しそうです。

回答までの時間を計測する

今回はPDFが20ファイル、総ファイルサイズが8MB程度で試しています。
同じ質問を5回ほどしてみましたがAmazon Qが回答するまでに要する時間は5回とも約9秒でした。なお、回答結果は毎回微妙に異なりました。
ChatGPTなどはリアルタイムで文章を生成して画面に表示していきますが、Amazon Qは回答の生成が完全に終わってから全文を画面に表示します。なので体感として遅いと感じます。

試しに、800KB程度のhtmlファイルを1つだけおいてコンテンツ検索を試してみたところ、回答までに要する時間は約7秒でした。
1KB以下のテキストファイルを1つだけおいてコンテンツ検索を試してみたところ、回答までに要する時間は約4.5秒でした。

ファイル数やファイルサイズによっても変わってくるようです。

リアルタイムのレコメンデーションを試す

これは顧客とオペレーターの通話音声の内容をもとに、リアルタイムでAmazon Qがリコメンドしてくれる機能です
公式ドキュメントは こちら です

通話音声を取得する部分など、内部的には Amazon Connect Contact Lens が利用されています。

Amazon Connect Contact Lensについては過去記事も書いていますので、下準備として必要な作業は以下も参照ください。

フローを作成する

Amazon Connectのフロー作成画面で、Amazon Qのブロックがあるのでこれを使います。
ドメインはさきほど作成したドメインを選択します

最終的に以下のようにBasic Queueに着信するフローを作成して、保存・公開します

電話番号を取得する

2024年5月時点で、日本の電話番号（03、050など）を取得するにはサポートケースを作成した上で、身分証明書を送る必要があります。

少し試したいのであれば、アメリカなど海外の電話番号を取得するほうが簡単です。東京リージョンでも海外の電話番号は取得できます。
ただし、海外の電話番号にかければ当然ながら国際電話扱いになるので通話料金に注意が必要です。
料金無料通話（≒フリーダイヤル）の電話番号だと、通話料金はAWS利用料に含まれる形になりますが、日本からだと着信しないケースが多いと思われます

電話番号が取得できたら、さきほど作成した着信フローに紐づけします

オペレータに着信させる

エージェントワークスペースでステータスをAvailableにして、さきほど取得した番号に電話をかけます。
着信したら 「通話を受信」 をクリックします

リアルタイムレコメンデーションの発動

はじめはなかなかレコメンデーションが発動しなかったのですが、"How do I ..." や "I need to ..." などのフレーズだと発動しやすいということで試したところようやく成功しました。

Costomer（顧客）の発話である

"How do I get my car to move?（車を動かすにはどうしたらいいですか？）"

という質問に対して、リアルタイムでAmazon QがResponseとSolutionを返しています。
どちらも内容はよく似ていますがResponseの方をみてみます。

"To get your car moving, press the brake pedal to shift into drive or reverse as shown on the touchscreen. Then press the accelerator to start moving in the selected direction."
（車を動かすには、ブレーキペダルを踏んで、タッチスクリーンに表示されているドライブモードまたはリバースモードに切り替えます。次に、アクセルペダルを踏んで、選択した方向に動き始めます。）

通常の車はシフトレバーを使ってドライブモードを切り替えるのが一般的ですが、テスラの新型モデル3はタッチスクリーンを使ってドライブモードやリバースモードを切り替えます。ということでS3バケットに格納したマニュアルを参照したうえで回答を生成していることがわかります。

なお、顧客の発話をAmazon Qが認識するまでに約3秒、そこから回答を生成して画面に表示するまでに約9秒、合計で12秒ほどかかりました。

さいごに

ここまで試してきた限り、可能性を感じるサービスです。
以下のような制約がクリアになれば、日本のコールセンターでも活用が進むと思うので期待したいです

日本語対応してほしい
1MB以上のファイルを扱えるようにしてほしい
パワポ、Excelなど扱えるファイルフォーマットを増やしてほしい
発話の認識速度、回答生成の速度をもっとあげてほしい
精度を向上してほしい（ナレッジベース for Bedrockとの連携など）

参考にしたサイト

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up