LoginSignup
9
14

More than 1 year has passed since last update.

AWSのAIサービスを整理してみた

Last updated at Posted at 2022-12-26

背景・目的

AWSの機械学習サービスに、どのようなものがあるかわかっていないので全体像を整理したいと思います。

まとめ

AIサービス 概要 ユースケース/利点
Amazon Augmented AI(Amazon A2I) 人によるレビューに必要なワークフローを簡単に構築できる機械学習サービス ヘルスケア
医療保険請求書、問診票、処方箋、その他多くの医療関係書類には、大切な情報が記載され、その情報を迅速かつ正確に抽出する必要がある。

Amazon A2I と Amazon Textract を使用すると、そういった文書を処理し、データを抽出し、重要なデータを人がレビューできる。これにより、文書処理の時間とコストを節約し、機微なデータや機密データまたは監査予測を人が継続的にレビューすることが可能。
Amazon CodeGuru セキュリティの脆弱性を検出し、コードレビューを自動化する Amazon CodeGuru Reviewer
コードレビューを自動化する。Java および Python コードでは見つけるのが難しい欠陥や脆弱性を検出し、それらを修正する方法に関する推奨事項を提供する。

コードのレビューを開始するには、GitHub、GitHub Enterprise、Bitbucket、または AWS CodeCommit の既存のコードリポジトリを CodeGuru コンソールで関連付ける。
Amazon Comprehend ドキュメント内のテキストから価値あるインサイトを導き出し、理解する 鉱山事業とコールセンターの分析
顧客のセンチメントを検出し、顧客とのやり取りを分析して、インバウンドサポートリクエストを自動的に分類。顧客調査からインサイトを抽出し、製品を改善。

製品レビューのインデックスおよび検索
検索エンジンにキーワードだけでなく、キーフレーズ、エンティティ、センチメントをインデックスする機能を持たせることで、コンテキストを重視。

法的書類の管理
契約書や裁判記録などの法的書類の中からインサイトを抽出する作業を自動化する。個人を特定できる情報 (PII) を識別して再編集することで、ドキュメントの安全性をさらに高める。

金融書類を処理する
保険金請求書や住宅ローンパッケージなどの金融サービスドキュメントからエンティティを分類、および抽出したり、金融記事の中の金融イベント間の関係を見つける
Amazon DevOps Guru 機械学習を活用したクラウドオペレーションでアプリケーションの可用性を向上 サーバーレスアプリケーションの可用性とパフォーマンスの向上
サーバーレスアプリケーションの運用上の問題の初期兆候を特定し、顧客に影響を与える前に修正する

Amazon RDS データベースのリカバリ時間を短縮する
RDSのデータベース関連のさまざまな問題を検出、評価、修復

可用性をスケールおよび維持する
静的ルールとアラームの自動更新により、時間と労力が節約される。これにより、複雑で進化するアプリケーションを効果的にモニタリングすることができる。

リソース制限をプロアクティブに特定
メモリ、CPU、ディスク容量などの枯渇性リソースがプロビジョニングされた容量を超える場合にアラートを受け取る。
Amazon Forecast 機械学習を用いて、ビジネスの成果を簡単かつ正確に予測 小売業と在庫予測
特定の確率レベルで商品の需要を予測することで、無駄を省き、在庫回転率を高め、在庫の可用性を向上させる

ワークフォース計画
15 分単位で人員配置を予測し、需要の高い時期と低い時期に最適化する

旅行需要予測
客足、訪問者数、チャネル需要を予測し、より効率的に運営コストを管理する
Amazon Fraud Detector 機械学習でオンライン不正をより早く検出 疑わしいオンライン決済の特定
支払いを処理して注文を履行する前に、疑わしいオンライン支払いトランザクションにフラグを立てることにより、オンライン支払い不正を減らす。

新規アカウント不正の検出
正当なアカウント登録とリスクの高いアカウント登録を正確に区別することで、電話や電子メールによる検証などの追加チェックをチェックを選択的に導入できるようにする。

トライアルプログラムやロイヤリティプログラムの不正使用の防止
オンラインサービスを不正使用する可能性のあるアカウントを特定し、オファーの値に適切な制限を設けることで、リスクを最小限に抑える。

アカウント乗っ取り検出の改善
リアルタイムのアカウントログインフローに簡単に組み込むことができ、正当なユーザーの摩擦を最小限に抑えながら、侵害されたアカウントを検出する
Amazon Kendra 機械学習を活用したインテリジェントなエンタープライズ検索で回答を迅速に見つける 従業員の社内検索エクスペリエンスを強化する
製品に関する質問への回答を顧客が簡単に見つけられるようにし、単一の検索インターフェイスを介してサービスを提供。

お客様とのやり取りを改善する
直感的なセルフサービスボット、エージェント支援ソリューション、フリクションレスなドキュメントアクセスにより、コンタクトセンターのコストを削減。

検索を SaaSアプリケーションに統合する
MLを利用したアプリ内検索で、ユーザーが情報をより迅速に見つけられるようにする。
Amazon Lex 会話型 AI を使用してチャットボットと音声ボットを構築する バーチャルエージェントと音声アシスタントの構築
仮想コンタクトセンターのエージェントと対話型音声応答 (IVR) により、セルフサービス機能を実現。ユーザーは、人間のエージェントと話すことなく、パスワードの変更や予約を行うことができる。

情報応答を自動化する
よくある質問に対する回答を提供する会話型ソリューションを設計。Kendra によるよくある質問の自然言語検索により、技術サポート、人事手当、財務に関する Connect と Lex の会話フローを改善する。

アプリケーションボットで生産性を向上させる
強力なチャットおよび音声ボットで、アプリケーションの基本的なユーザータスクを自動化。Lambda を介して他のエンタープライズのソフトウェアとシームレスに接続し、IAMを介してきめ細かいアクセスコントロールを維持することができる。

トランスクリプトに含まれる情報を最大化する
既存のコンタクトセンターのトランスクリプトを使用して、数週間ではなく数時間でチャットボットを設計する。設計にかかる時間を数週間から数時間に短縮し、ボットのデプロイを加速する。
Amazon Lookout for Equipment 機器の異常な動作を自動的に検出することにより、計画外のダウンタイムを回避 発電機のシャットダウンを検出する
流量、温度、圧力、および酸素レベルに関するセンサーデータを正確にモニタリングし、アラートを取得して、不適切なタイミングでシャットダウンしないようにする。

機械の異常な動作を特定する
RPM、流量、温度、圧力、振動に関する過去のメンテナンスデータとセンサーデータを分析して、傾向を把握する。

時間の経過に合わせてアラートの精度を向上させる
異常に関する人間のフィードバックを取り入れ、予測された運用上の使用傾向を学習することで、モデルのパフォーマンスとアラートの精度を向上させる。
Amazon Lookout for Metrics メトリクス内の異常を自動的に検出して、その根本原因を特定 業績をモニタリングする
サブスクリプション、コンバージョン率、収益における異常な差異を特定して、突然の変化を常に把握できるようする。

カスタマーエクスペリエンスを改善する
メトリクスの急激な増減を検出して、顧客関連の問題、解約率、およびインストール率または購入率をより良く理解する。

デジタル広告の支出を最適化する
手作業による介入を必要とせずに、キャンペーンの支出超過、パフォーマンス低下、またはエラーの発生を自動的に把握する。

ユーザーのエンゲージメントを強化する
新規ユーザー、アプリのインストール、アプリ内購入、およびリテンションの変動を把握して、ユーザーエンゲージメントを最適化する。
Amazon Lookout for Vision コンピュータビジョンを使用して製品欠陥を検出し、品質検査を自動化 部品の損傷を検出
製造や組み立ての過程で、製品の表面品質、色、形状などの損傷を発見。

欠落しているコンポーネントを特定
プリント基板のコンデンサが欠けているなど、物体の有無や配置に基づいて、何が欠けているかを判断。

プロセスの問題を明らかにする
シリコンウェーハの同じ場所に繰り返される傷のように、繰り返しパターンで欠陥を検出する。
Amazon Monitron 予知保全と機械学習で計画外の機器のダウンタイムを削減 簡単にインストールできるハードウェアと機械学習の力で、コストのかかる修理を省き、工場の機器のダウンタイムを防ぐ。

・ファン
・ベアリング
・コンプレッサー
・モーター
・ギアボックス
・ポンプ
Amazon Personalize ML を活用したパーソナライゼーションでカスタマーエクスペリエンスを向上させる レコメンデーションを最適化する
デプロイを迅速化するために、小売、メディア、エンターテインメントなどの業界向けにパーソナライズされたレコメンデーションの作成と維持を自動化する。

顧客のターゲティングをより正確に行う
ML を適用して、製品、カテゴリ、ブランドなどの希望に基づいてユーザーをセグメント化することで、より効果的なプロスペクティングキャンペーンを実行する。

データの価値を最大化する
製品の説明、レビュー、または他の構造化されていないテキストに存在する情報を活用できるようにして、より関連性の高いレコメンデーションを生成する。

ビジネスルールを使用して商品のプロモーションを実施する
可能な限り関連性が高くなるようにしながら、ビジネス目標に基づいて特定の商品のプロモーションを実施することで、レコメンデーションをカスタマイズする。
Amazon Polly 数十の言語で高品質で自然な人間の声を展開 数十の言語で音声を生成する
RSS フィード、ウェブサイト、動画など、世界中のオーディエンスが利用するアプリケーションに音声を追加する

自然な声で顧客を惹き付ける
Amazon Polly の音声出力を保存および再生し、インタラクティブまたは自動化された音声応答システムを通じて発信者にプロンプトを表示する。

発話スタイル、音声の速さ、高さ、大きさを調整する
音声合成アプリケーション用の W3C 標準の XML ベースのマークアップ言語である SSML を使用して、言い回し、強調、イントネーション用の一般的な SSML タグをサポート。
Amazon Rekognition 機械学習を使用して画像と動画の分析を自動化する 不適切なコンテンツを検出する
一般的またはビジネス固有の基準と慣行に基づいて、画像および動画アセット全体で危険または不適切なコンテンツをすばやく正確に特定する。

オンラインで本人確認
ユーザーのオンボーディングおよび認証のワークフローで顔比較と分析を使用して、オプトインしたユーザーのアイデンティティをリモートで確認できる。

メディア分析の合理化
主要な動画セグメントを自動的に検出して、動画広告の挿入、コンテンツのオペレーション、およびコンテンツ制作の時間、労力、コストを削減する。

コネクテッドホームスマートアラートの送信
ライブビデオストリームで目的のオブジェクトが検出されたときに、タイムリーで実用的なアラートを配信する。人物が検出されたときにライトを自動的にオンにするなど、オートメーションエクスペリエンスを創出できる。
Amazon Textract 印刷されたテキスト、手書きの文字、およびデータをすべてのドキュメントから自動的に抽出 金融サービス
住宅ローンの金利、申請者の名前、請求書の合計額などの重要なビジネスデータをさまざまな財務フォームから正確に抽出して、ローンや住宅ローンの申請を数分で処理。

ヘルスケアおよびライフサイエンス
受診報告書、保険金請求、および事前承認用書類から重要な患者データを抽出することで、患者および保険会社により良いサービスを提供。データを元の文脈に沿って整理し、出力を手動で確認する必要性を排除する。

公共部門
中小企業向けローン、連邦税申告書、ビジネスアプリケーションなどの政府関連フォームから、関連データを高い精度で簡単に抽出する。
Amazon Transcribe 音声をテキストに自動的に変換する 顧客との会話からインサイトを得る
Transcribe Call Analytics を使用すると、顧客との会話から実用的なインサイトを迅速に抽出することができる。AWS Contact Center Intelligence パートナーと Contact Lens for Amazon Connect は、カスタマーエンゲージメントを改善し、エージェントの生産性を高め、スーパーバイザーへの表面品質管理アラートを提供するターンキーソリューションを提供。

メディアコンテンツを検索して分析する
コンテンツ制作者やメディア配信者は、Amazon Transcribe を使用して、音声と動画のアセットを完全に検索可能なアーカイブに自動的に変換し、コンテンツの検出、ハイライトの生成、コンテンツの調整、および収益化を行うことができる。

字幕と会議メモを作成する
オンデマンドおよびブロードキャストコンテンツに字幕を付けて、アクセシビリティを向上させ、カスタマーエクスペリエンスを改善する。Amazon Transcribe を使用して、生産性を高め、重要な会議や会話を正確にキャプチャする。

臨床文書を改善する
医師や開業医は、Amazon Transcribe Medical を使用して、臨床上の会話を電子医療記録 (EHR) システムに迅速かつ効率的に文書化して分析できる。このサービスは HIPAA に対応しており、医療用語を理解するようにトレーニングされている。
Amazon Translate なめらかで正確な機械翻訳 言語のローカリゼーション
Amazon Translate を使って、大量のユーザー生成コンテンツをリアルタイムで簡単に翻訳が可能。ウェブサイトやアプリケーションはフィードストーリー、プロフィール詳細、投稿コメントなどのさまざまな言語のコンテンツを、「翻訳」ボタンをクリックするだけで自動的にユーザーの好みの言語に翻訳できる。

テキスト分析
さまざまな言語で行われるオンラインの会話をモニタリングし、ブランド、製品、サービスについて顧客が抱いている感情を知ることができる。Amazon Comprehend のような自然言語処理 (NLP) アプリケーションの前段でテキストを英語に翻訳して、多数の言語で構成されるテキストコンテンツを分析できる。

通信
アプリケーションのユーザー間の異言語コミュニケーションを実現する自動翻訳機能を利用できる。
チャット、E メール、ヘルプデスク、チケット発行アプリケーションにリアルタイム翻訳機能を追加すれば、英語のみを話す担当者や従業員でも複数の言語で顧客とコミュニケーションをとることができる。
AWS Panorama エッジでのコンピュータビジョンでオペレーションを改善 サプライチェーンロジスティクスの改善
スループットの追跡、貨物オペレーションの最適化、部品や製品などのオブジェクトや、ラベルやバーコードのテキストの認識を簡単に行える。

交通管理の最適化
交通レーンに停車している車両などの問題をモニタリングし、リアルタイムでスタッフにアラートを送り、交通の流れを確保

製造品質の評価
製造上の異常を迅速に検出し、是正措置を講じ、コストを削減する

特徴

Amazon Augmented AI(Amazon A2I)

統合が簡単

  • A2Iは、ドキュメント処理用の Amazon Textract とコンテンツモデ用の Amazon Rekognition と統合
  • A2I コンソールで数回クリックするだけ、あるいは API パラメータをいくつか使用するだけで、これらのユースケースを人間の手で確認するワークフローを実装できる
  • A2I API を使用すると、Amazon SageMaker または他の機械学習ツールで構築したカスタムモデルにワークフローを統合できる

組織内外のレビュー担当者と連携する柔軟性

  • A2I は人間のレビュー担当者向けに、複数の選択肢をサポート
  • 組織外に持ち出すことができない機密データを処理する場合などは、レビューを担当するプライベートチームが社内のレビュー作業を行うことが可能
  • レビュー担当者の人数を増やす必要があり、データに機密情報や個人情報が含まれていない場合、Amazon Mechanical Turk を使用すれば、世界中で 50 万社を超える請負業者を 24 時間年中無休、オンデマンドで利用可能
    • Mechanical Turkは、クラウドソーシング向けの市場で、お客様のレビュー作業の需要と、それらの作業をリモートで実行できる世界各地の作業者がマッチングされる。あるいは、AWS Marketplace を介して、サードパーティのベンダーを使うことができる。

レビュー担当者のための手順を簡単に提供

  • A2I は、人間のレビュー担当者に一貫性を確保するための手順を案内する。
  • レビュー担当者は、それらの詳細な手順を各自のレビューのインターフェイス内で確認できる。
    • これらの手順は随時更新でき、これにより、レビュー担当者の作業が不適切であることに気付いた場合に詳細情報を追加したり、ニーズの変化に基づいて手順を調整することが容易になる。

人によるレビュープロセスを簡素化するワークフロー

  • A2I では、予測をレビュー担当者にルーティングし、レビュー担当者がタスクごとに段階的に実行するための、ビルトインのワークフローを提供
    • ワークフローが予測をレビュー担当者にルーティングするには、信頼しきい値またはランダムサンプリングパーセンテージのいずれかの条件が必要
    • 信頼しきい値
      • ワークフローは人によるレビューのしきい値を下回る予測のみをルーティングする。
      • これらのしきい値はいつでも調整して、精度と費用対効果の適切なバランスを実現できる
    • サンプリングの割合
      • ワークフローは人によるレビューのために予測のランダムサンプルをルーティングする。
      • モデル監査を実装し、モデルの精度を定期的にモニタリングできるようになる。
  • ワークフローには、レビュー担当者がタスクを完了するために必要なすべての指示とツールを含むウェブインターフェイスも装備している。
    • Amazon A2I は、テキスト抽出や画像モデレーションのユースケース用にビルトインのワークフローを提供
    • A2I は、テキスト抽出や画像モデレーションのユースケース用にビルトインのワークフローを提供
    • 人によるレビューをトリガーするタイミングを A2I に伝えるために記述するLambda 関数を提供したり、60 個を超える HTML テンプレート、または新しいテンプレートのいずれかを使ってウェブインターフェイスを作成することで、カスタムワークフローを構築することも可能

複数のレビューを使って結果を改善する

  • 複数のレビュー担当者を使って、結果の信頼度を高めることができる
  • レビューごとに担当者の数を指定できる

Amazon CodeGuru

Amazon CodeGuru Reviewer

  • Java および Python コードの問題を検出し、コードを改善するためのレコメンデーションを提供

セキュリティ検出

  • コードセキュリティの強化を支援し、一般的な脆弱性 (OWASP トップ 10) と AWS の内部的なセキュリティに関するベストプラクティスに基づいてレコメンデーションを提供

  • 自動推論を使用して、ソースからシンクへのデータフロー、および複数の機能にわたるデータフローを分析し、見つけにくいセキュリティの脆弱性を検出

  • 下記をサポート(2022/12/24現在)

    • Java8〜11
    • Python3〜
  • 下記のようなコードセキュリティに関する問題をサポート

    • OWASPトップ10
      • アクセスコントロールの失敗、インジェクション、データ整合性の失敗など、ウェブアプリケーションの上位のセキュリティリスクをチェック
    • AWS API セキュリティに関するベストプラクティス
      • EC2、KMSのAPIをセキュリティを確認
    • AWS のセキュリティに関するベストプラクティス
      • Amazon の内部的なセキュリティに関する専門知識をコードに適用
    • Java 暗号ライブラリに関するベストプラクティス
      • Javax.Crypto.Cipher が初期化され、正しく呼び出されるかどうかを確認
    • Python 暗号ライブラリに関するベストプラクティス
      • 正しいバージョンの Python のハッシュと暗号アルゴリズムが使用されているか
    • 安全なウェブアプリケーション
      • LDAP インジェクションなどのアプリケーション関連のセキュリティ問題を確認
    • 機密情報の漏えい
      • 個人情報または機密情報の漏えいをチェック
    • 入力検証
      • 信頼されないソースから送られる、不適当な形態の、または悪意のあるデータを確認
    • ログインジェクション
      • コードが偽造されたログエントリや悪意のあるコンテンツのログへのインジェクションを適切に防止しているかをチェックすることにより、Log4jタイプの脆弱性
  • CodeGuru コンソールに移動して、リポジトリ全体でセキュリティ分析を呼び出すか、GitHub Actions を介して CI/CD と統合できる

シークレットの検出

  • 機械学習ベースの分析を使用して、パスワード、API キー、SSH キー、アクセストークン、データベース接続文字列、JSON ウェブトークンなど、リポジトリまたは設定ファイルにハードコードされているシークレットを検出する
  • CodeGuru Reviewer の一部である Secrets Detectorは、これらのシークレットのコードをチェックし、AWS Secrets Manager を使用してポイントアンドクリックでそれらを保護できるようにする自動化されたメカニズム
  • AWS、Atlassian、GitHub、Salesforce、HubSpot、Stripe などの最も一般的な API プロバイダーによって生成された特定のキーを識別可能

コード品質

  • CodeGuru Reviewer は、コード品質の問題を特定し、開発チームがソフトウェア開発プロセスで高いコーディング標準を維持できるようにする
    • AWS のベストプラクティス
      • AWS API (例: ポーリング、ページ割り) の使用方法を修正
    • Java と Python のベストプラクティス
      • 一般的な Java と Python の言語とライブラリ機能の正しい使用
    • 同時実行
      • 機能上の障害を引き起こしている同期不良、またはパフォーマンスの問題を生じさせている過剰な同期を検出
    • 不整合
      • リポジトリ内のコーディングパターンを分析し、標準パターンから逸脱した異常がある場合の検出に役立つ
    • コードの保守容易性
      • コードの複雑さや、コードのメンテナンスを困難にするソースコードの特性
    • リソースリーク
      • リソースの処理を修正 (例: データベース接続の解放)
    • 一般的なコーディングのベストプラクティス
      • パラメータをチェックし、バグ (オブジェクトを使用する前に null かどうかをチェックするのを忘れる、同期されたオブジェクトを再割り当てする、または例外パスに沿って変数を初期化するのを忘れる、など) を引き起こす可能性のあるコード行を探す。
    • コードのクローン作成
      • 統合することでコードの保守性を高められる可能性のある重複コードを特定する

自動レコメンデーション

  • CodeGuru Reviewer がレコメンデーションを提供するために実行できるコードレビューには、増分コードレビューとフルリポジトリコードレビューの 2種類ある。
  • 増分コードレビュー
    • 関連付けられたリポジトリからプルリクエストを作成すると、増分コードレビューが自動的に作成される。
    • これらのコードレビューは、プルリクエストで変更されたコードをスキャンする。CodeGuru Reviewer は、すべてのコードレビューの情報 (例: コードレビューのステータス、分析されたコードの行数、レコメンデーションの数) を一覧表示するプルリクエストダッシュボードも提供する。
    • CodeGuru Reviewer の標準月額料金には、オンボーディングされたリポジトリのすべての増分コードレビュー分析が含まる。
  • フルリポジトリ分析コードレビュー
    • CodeGuru Reviewer を使用すると、指定されたコードブランチの下で、関連するリポジトリ内のすべてのコード行について、機械学習を利用したコードレビューのレコメンデーションを取得できる
    • フルリポジトリスキャンを実行して、コードの移行、コードのデューデリジェンス、定期的なコードのメンテナンスの取り組み中にコードレビューのレコメンデーションを取得できる
    • CodeGuru コンソールで、[Code Reviews] (コードレビュー) ページの [Repository Analysis] (リポジトリ分析) タブに移動して、フルリポジトリで新しい分析を開始できる。
    • 新しいリポジトリサイズベースの料金モデルには、2 つのフルリポジトリスキャンが含まれている。

CI/CD と GitHub Actions の統合

  • CodeGuru Reviewer の CI/CD エクスペリエンスを使用すると、GitHub アクションを使用して CI ワークフロー内のステップとしてコード品質とセキュリティ分析を呼び出すことができる。
  • パイプラインのPull、Push、またはスケジュールされた実行において実行し、レコメンデーションを提供するよう設定可能。
  • CI/CD を介して CodeGuru Reviewer スキャンを呼び出すと、CodeGuru Reviewer コンソールまたは GitHub のユーザーインターフェイス内でコードの品質とセキュリティのレコメンデーションを表示できる。
  • CI/CD 統合を使用すると、コードの品質とセキュリティを継続的にモニタリングして、レコメンデーションを見逃さないようにすることができる。
  • CodeGuru Reviewer では、GitHub Marketplace にある GitHub Action を使用して、GitHub のユーザーインターフェイス内でセキュリティレビューを行い、レコメンデーションを直接受け取ることが可能。
  • オンボーディングすると、GitHub の [Security] タブ内にレコメンデーションが直接表示される。

Amazon CodeGuru Profiler

  • Amazon CodeGuru Profiler はアプリケーションパフォーマンスの最適化策を常に探索しながら、最も「コストがかかる」コード行を特定する。さらにそれらを修正して CPU 使用率を削減し、計算コストの削減を行い、アプリケーションパフォーマンスを改善するための推奨方法を示す。
  • たとえば、CodeGuru Profiler により、アプリケーションがコアビジネスロジック実行のためではなく、ログ記録ルーチンのために過剰な CPU 容量を消費している場合を識別可能。

実稼働環境にあるアプリケーションの定常的なプロファイリング

  • CodeGuru Profiler は、最小限のオーバーヘッドで本番環境で継続的に実行されるように設計されている
  • アプリケーションのパフォーマンスへの影響を最小限に抑えて、常時稼働させることができる。これにより、実際の顧客のトラフィックパターンを使用してアプリケーションのプロファイルとトラブルシューティングを行い、パフォーマンスの問題を簡単に発見できる
  • プロファイラーデータと ML を利用した推奨事項を使用すると、本番環境でのアプリケーションのパフォーマンスの問題を特定して修正できる。
  • CodeGuru Profiler はヒープサマリーも提供するため、いつでもどのオブジェクトがメモリを消費しているかを特定できる。

アプリケーションの実行時の動作を把握する

  • CodeGuru Profiler は、アプリケーションの CPU使用率、ヒープ使用量、レイテンシー特性を継続的に分析して、アプリケーションのサイクルもしくは実行時間において最も消費量が多い部分を示す。
  • CPU とレイテンシー分析はインタラクティブなフレームグラフで表示されるので、どのコードパスが最もリソースを消費しているかを視覚的に簡単に理解でき、アプリケーションが期待どおりに実行されていることの確認や、さらに最適化できる領域を明らかにするのに役立つ。

ヒープサマリーのまとめ

  • ヒープ使用量の分析は、ヒープサマリービジュアライゼーションに表示される。
  • ヒープに割り当てられているオブジェクト(独自のドメインクラス、ライブラリまたは JDK が所有するオブジェクト)を示す。

インテリジェントな推奨事項

  • CodeGuru Profiler は、アプリケーションのパフォーマンスの問題を自動的に識別し、その修正方法に関する ML を利用した推奨事項を提供する。
  • これらの推奨事項は、コード内で最もコストがかかる手段またはリソースを集中的に使用している手段を特定して最適化するのに役立つ。
  • 最適化を行うことで、インフラストラクチャのコストを削減し、レイテンシーを短縮し、エンドユーザーエクスペリエンス全体を改善するのに役立つ。

異常検出

  • CodeGuru Profiler は、アプリケーションプロファイルをリアルタイムで継続的に分析し、アプリケーションやメソッドの動作から異常を検出する。
  • 各異常の追跡結果は、CodeGuru Profiler コンソールの [Recommendation] (推奨事項) レポートに記載する。
  • 異常が明確に現れる時点でのメソッドのレイテンシーの振る舞いを、時系列的に確認することができる。また、新たな異常が検出されたときに通知を送るように、Amazon SNS を設定することもできる。

Amazon Comprehend

  • Amazon Comprehend は、機械学習を使用してテキストから洞察を見つける自然言語処理 (NLP) サービス
  • Custom Entity Recognition、カスタム分類、キーフレーズ抽出、感情分析、エンティティ認識などの API を使用することにより、アプリケーションに自然言語処理を簡単に統合できる。
  • Comprehend API をアプリケーションに読み込むだけで、ソースとなるドキュメントやテキストの場所がわかる。
  • API は、エンティティ、キーフレーズ、感情、言語を、アプリケーションで使用できる JSON 形式で出力する。

Custom Entity Recognition

  • Custom Entity Recognition を使用するとComprehend をカスタマイズして、ドメインに固有の用語を識別
  • AutoML を使用して、少量の例 (例えば、ポリシー番号、請求番号、または SSN のリストなど) から学習し、機械学習を必要とせずに、PDF、プレーンテキスト、または Microsoft Word ドキュメント内の他のテキストブロック内の請求番号などの用語を認識するように、プライベートなカスタムモデルをトレーニングする。

カスタム分類子

  • カスタム分類子 API を使用すると、ML を学習することなく、ビジネス特有のラベルを使用してカスタムのテキスト分類モデルを簡単に構築できる
    • たとえば、カスタマーサポート組織はカスタム分類子を使用して、顧客がどのように問題を記述したかを元に、インバウンドリクエストを問題のタイプで自動的に分類できる
  • カスタムモデルを使用すると、ウェブサイトのコメントの調整、お客様からのフィードバックのトリアージ、ワークグループドキュメントの整理が簡単にできる。

エンティティ認識

  • エンティティ認識 API は、提供されたテキストに基づいて自動的に分類される名前付きエンティティ (「人」、「場所」、「位置」など) を返す。

感情分析

  • テキストの全体的な感情 (肯定的、否定的、中立的、または混在) を返す。

Targeted Sentiment

  • テキスト内のエンティティに対する感情 (肯定的、否定的、中立的、または混在) を識別することで、より詳細な感情のインサイトを提供する。

PII 識別とリダクション

  • 機械学習機能を使って、顧客の電子メール、サポートチケット、製品レビュー、ソーシャルメディアなどに含まれる個人を特定できる情報 (PII) を検出し、リダクションする。
    • 例えば、サポートチケットやナレッジ記事を分析して PII エンティティを検出し、検索ソリューションにドキュメントをインデックスする前にテキストをリダクションすることができる。
    • その後、検索ソリューションでは、ドキュメントに PII エンティティが含まれないようにする。
    • PII エンティティをリダクションすることで、プライバシーを保護し、現地の法律や規制を遵守することができる。

キーフレーズ抽出

  • キーフレーズまたは論点と、これがキーフレーズであることを裏付ける信頼性スコアを返す。

イベント検出

  • Comprehend Events は、ドキュメントからイベント構造を抽出し、何ページにもわたるテキストを簡単に処理できるデータに変換して、AI アプリケーションやグラフ可視化ツールで利用することができる。
  • この API を使えば、大きなドキュメントセットに対して大規模に、「誰が」「何を」「いつ」「どこで」といった質問に、NLP の経験が以前になくても回答することができる。
  • Comprehend Events を使用して、非構造化テキストで表現された実世界のイベントや関連するエンティティに関する詳細な情報を抽出する。

言語検出

  • 言語検出 API は、100 を超える言語で書かれたテキストを自動的に識別し、主要言語と、言語が主要であることを裏付ける信頼性スコアを返す。

構文解析

  • Comprehend Syntax API を使用すれば、お客様は、トークン分割や品詞 (PoS) を使用してテキストを分析したり、テキスト内の名詞や形容詞などの単語境界やラベルを識別できる。

トピックモデリング

  • S3 に格納された一連のドキュメントから、関連する用語またはトピックを識別する。
  • コレクション内の最も一般的なトピックを識別し、それらをグループに整理し、次にどのドキュメントがどのトピックに属しているかをマップする。

多言語サポート

  • Comprehend は、次の言語のテキスト分析を実行できる。
    • ドイツ語
    • 英語
    • スペイン語
    • イタリア語
    • ポルトガル語
    • フランス語
    • 日本語
    • 韓国語
    • ヒンディー語
    • アラビア語
    • 中国語 (簡体字)
    • 中国語 (繁体字)
  • その他の言語でアプリケーションを構築する場合、Amazon Translate を使用してテキストを Comprehend がサポートする言語に変換した後、Comprehend を使用してテキスト分析を行うことが可能。

Amazon DevOps Guru

複数のソースからの運用データを統合する

  • Amazon CloudWatch メトリクス、AWS Config、AWS CloudFormation、AWS X-Ray などの複数のソースからの運用データのストリームを継続的に分析および統合し、運用データの異常を検索して視覚化するための単一のコンソールダッシュボードを提供する。これにより、複数のツールを使用する必要性が少くなる。
  • これにより、この委任された管理者は、組織内のすべてのアカウントからのインサイトを表示、並べ替え、およびフィルタリングして、追加のカスタマイズを必要とすることなく、モニタリング対象のすべてのアプリケーションのヘルスに関する組織全体のビューを作成できる。

機械学習を利用したインサイトで時間を節約

  • 機械学習を利用した推奨事項を利用することで、アプリケーションの可用性を向上させ、手作業を減らして運用上の問題をより迅速に修正する。
  • メトリック、ログ、イベント、およびトレースを継続的に取り込んで分析し、アプリケーションの動作の通常範囲を確立する
  • 次に、DevOps Guru は通常の動作からの逸脱を探し、異常を集約して、アプリケーションのコンポーネントの関係に基づいて運用上の洞察を作成する。
  • 運用上の洞察には、影響を受けるコンポーネントに関する情報、関連する異常の特定、AWS CloudTrail イベントなどのコンテキストデータを使用して修正する方法に関する推奨事項が含まれる。

アラームを自動的に構成する

  • デベロッパーと運営者は、Amazon DevOps Guru がアプリケーションのアラームを構成および設定できるようにする。
  • アプリケーションが進化し、新しいサービスを採用すると、DevOps Guru は新しいリソースを自動的に認識し、関連するメトリクスとログを取り込む。
  • 次に、ルールやアラームを手動で更新しなくても、通常の動作パターンから逸脱した場合に警告を発する。

最小限のノイズで最も重大な問題を検出する

  • AWS の内部運用データでトレーニングされた機械学習モデルを使用して、アプリケーションに影響を与える重大な問題に対し、正確な運用上のインサイトを提供

デプロイや管理のための追加のソフトウェアが不要なワンクリックのデプロイ

  • マネジメントコンソールでワンクリックするか、単一の API コールで、1 つのアカウントで Amazon DevOps Guru を有効にできる。
  • AWS Organizationsの統合によるマルチアカウントのインサイトの可視化もサポート。
  • 有効にすると、DevOps Guru は機械学習を使用して、アプリケーションメトリクス、ログ、イベント、通常の動作パターンから逸脱した動作などのデータを自動的に収集して分析する。
  • デプロイや管理のための追加サービスない。

AWS のサービスおよびサードパーティーツールと統合する

  • Amazon CloudWatch、AWS Config、AWS CloudFormation、および AWS X-Ray とネイティブに統合して、アプリケーションコンポーネント間の接続と依存関係を検出および追跡する。
  • Systems Manager および EventBridge との統合も行う。
    • Systems Manager との統合により、DevOps Guru が生成するインサイトごとに OpsCenter で OpsItem を自動的に受け取ることができる。これにより、OpsCenter の機能を活用して、運用上の問題をさらに迅速に表示、調査、および解決できる。
    • EventBridge との統合により、どこに通知を送信するかを決定するためのルーティングルールのセットアップ、通知を送信するだけか、事前定義された DevOps Guru パターンに一致するアクションをトリガーするためのそのパターンの使用 (例:「New Insights Open (新しいサイトがオープン)」でのみ送信)、または通知を送信するためのカスタムパターン作成が可能になる。
  • DevOps Guru は、DevOps Guru から SNS 通知を取り込むことができる PagerDuty および Atlassian のサードパーティーインシデント管理ツールとも統合されているため、プラットフォーム内でインシデントを自動的に管理できる。

Amazon DevOps Guru for RDS

  • Amazon DevOps Guru は機械学習 (ML) を活用したサービスで、すべてのAmazon Relational Database Service(RDS)エンジンで利用でき、アプリケーションのオペレーションパフォーマンスと可用性の改善を容易に実現可能。
  • Amazon DevOps Guru for RDS がデータベース関連問題(リソースの過剰使用や特定の SQL クエリの動作不良など)を検出すると、このサービスは、直ちに通知を行い、診断情報、問題の程度に関する詳細、および問題を迅速に解決するためのインテリジェントなレコメンデーションを提供する。
  • DevOps Guru for RDS を使って、 データベースのパフォーマンスのボトルネックやオペレーションの問題点をモニタリングできる。
  • スタートするには、RDSコンソールで Amazon RDS Performance Insights をオンにし、Amazon DevOps Guru コンソールにナビゲートして、Amazon Auroraリソース、その他のサポートされたリソース、またはアカウント全体のサービスを有効にする。
  • Amazon RDS コンソール内から新しいデータベースを作成する際に、Amazon Aurora データベースに対して Amazon DevOps Guru for RDS を有効にすることができる。さらに、Performance Insights (PI) ページ内から Amazon DevOps Guru for RDS を有効にするオプションも用意されている。
  • DevOps Guru for RDS は現在、Amazon Aurora MySQL 互換エディションとAmazon Aurora PostgreSQL 互換エディションをしている。(後日、Amazon RDS データベースエンジンの追加サポートも予定)

RDS データベースパフォーマンスのボトルネックとオペレーション問題を検出、診断

  • DB ロードやデータベースカウンターなどのデータベースのテレメトリ、オペレーティングシステムのメトリクスをデータベース上で継続的に分析し、関連する異常を自動的に検出・相関させ、リレーショナルデータベースの問題を数分で解決できるようにする。

自動的に通知を受け取ることができるようにAWS のサービスとネイティブに統合

  • フォーマンスのボトルネックや運用上の問題を検出すると、DevOps Guru コンソールに結果を表示し、EventBridge と SNSなど AWS のサービスを使って通知を送信する。こうして、影響を与えるような停止状態となる前に、デベロッパーがパフォーマンスや運用上の問題を自動的に管理し、リアルタイムに対処することができる。

解決までの時間を数日から数分に短縮

  • 何百ものデータベースメトリクスを検索せずに、パフォーマンスやオペレーション問題の原因をすばやく理解できるように設計されている。
  • インテリジェントなレコメンデーションと修復ステップにより、デベロッパーや DevOps エンジニアは、データベースエキスパートの助けを借りずに、数分で問題を解決することができる

Amazon DevOps Guru for Serverless

  • 機械学習 (ML) を利用したサービスで、AWS Lambda を使用するサーバーレス アプリケーションで利用できる。
  • このサービスは、長年にわたる Amazon.com と AWS の運用上の卓越性に基づいた ML モデルを使用して、アプリケーションの運用パフォーマンスと可用性を向上させる。
  • 開発者または DevOps エンジニアは、DevOps Guru を使用して、関数、リソース、または集計レベルで異常な動作を自動的に検出し、リソース全体の異常を 1 つの問題に関連付けることができる。
  • DevOps Guru が Lambda 関数のプロビジョニングされた同時実行キャパシティーが低いなどの問題を検出すると、サービスは、その異常をもたらした関連するメトリクス、ログ、およびイベントを 1 つの運用上の洞察に結び付け、問題を迅速に解決するのに役立つインテリジェントな推奨事項を提供。
  • また、このサービスは、将来的にアプリケーションに影響を与える可能性のある運用上の問題を回避するのに役立つ推奨事項を含むプロアクティブな洞察も提供。
  • DevOps Guru を使用すると、サーバーレス アプリケーションのパフォーマンスと運用の問題を監視できる。
  • 開始するには、DevOps Guru コンソールに移動して、Lambda ベースのアプリケーション、その他のサポートされているリソース、またはアカウント全体のサービスをアクティブ化する。

Proactively identify and address operational issues

  • DevOps Guru for Serverless を使用して、アプリケーションの問題をプロアクティブに検出し、顧客に影響を与えるイベントが発生する前に問題を修正および修正するのに役立つ推奨事項を受け取る。
  • これらのプロアクティブな洞察は、将来の運用上の問題の兆候を早期に特定できる ML アルゴリズムを使用して、運用データとアプリケーション メトリックを分析することによって作成される。
    • たとえば、プロビジョニングされた同時実行数が Lambda ベースのアプリケーション スタックに対して低く設定されている場合、DevOps Guru は同時実行スピルオーバー呼び出しを示すプロアクティブな洞察を生成する。
  • このインサイトは、インサイトの説明、重大度、ステータス、影響を受けるアプリケーションの数などの概要情報を提供する。 また、プロビジョニングされた同時実行数を増やして使用率のバランスを維持するための推奨事項も含まれている。

Optimize application performance

  • DevOps Guru は Amazon CodeGuru Profiler と統合されているため、アプリケーションのパフォーマンスの問題をより簡単に追跡して、原因となっている根本的なコードを特定し、問題をより迅速に解決できる。
    • たとえば、呼び出しごとに Lambda 関数が SDK サービス クライアントを作成する (したがって実行時間が長くなる) と、CodeGuru Profiler はこのコードの非効率性を警告し、DevOps Guru にプロアクティブな洞察として表示される。

Easily deploy and integrate with AWS services and third-party tools

  • AWS マネジメント コンソールで 1 回クリックするか、1 回の API 呼び出しで、サーバーレス アプリケーションの DevOps Guru を有効にする。
  • サービスが運用上の問題を検出すると、その結果が DevOps Guru コンソールに表示され、EventBridge と SNSを介して通知が送信される。 その後、顧客に影響を与える停止になる前に、運用上の問題を自動的に管理し、リアルタイムのアクションを実行できる。

Amazon Forecast

アドバンストな自動化された機械学習

  • Amazon Forecast は、機械学習 (ML) を使用して、より正確な需要予測をわずか数クリックで生成する。
  • Amazon.com における 20 年以上にわたる予測の経験と、培われた専門知識に基づくアルゴリズムが含まれており、Amazon で採用されているのと同じ技術をデベロッパー向けにフルマネージドサービスとして提供することで、リソースの管理を不要にしている。
  • 機械学習を用いて、各項目に最適なアルゴリズムを学習するだけではなく、各項目のアルゴリズムの最適な組み合わせも学習し、データに最適なモデルを自動的に作成する。

ノーコードデプロイによる迅速なオンボード

  • CloudFormation と Step Functions を使用して、データのインポートから予測まで、完全なエンドツーエンドのワークフローをコード不要で迅速にデプロイし、市場投入までの時間を短縮。
  • 必要なスケジュール (毎日、毎週など) で継続的にワークフローを実行するように設定し、スケーラブルで反復可能な生産プロセスを構築

モデルの品質を自動的かつ継続的にモニタリングする

  • 新しいデータがインポートされると、時間の経過とともにモデルの精度を自動的に追跡する。
  • モデルの初期品質メトリクスからの偏差を体系的に定量化し、新しいデータが入ってきたときに、モデルの維持、再トレーニング、再構築について、より多くの情報に基づいた決定を行うことができる。
  • これにより、経済環境の変化や消費者行動の変化など、モデルの予測能力に影響を与え得る外部要因に迅速に対応することができる。

予測の説明可能性

  • 料金、休日、天候など、どのような要因が予測に影響を与えているかを調べることができる。
  • 予測の説明可能性レポートを、すべての予測、関心のある特定の時系列、または特定期間の影響スコアの形で提供。説明可能性は、お客様のビジネスオペレーションをより良く管理するためのより多くのインサイトを提供する。

リージョンの気象情報を自動的に含める

  • 天気予報を使用すれば、Amazon Forecast では、リージョンの気象情報をワンクリックで自動的に需要予測に取り込むことで、予測の精度を高めることができる。追加費用は不要。
  • 気象条件は、消費者の需要パターン、製品商品化における意思決定、人員配置の要件、およびエネルギー消費のニーズに影響を与える。
  • Weather Index を使用すると、Forecast は、運用場所の過去の天気情報を使用してモデルをトレーニングし、日々の変動の影響を受ける製品に 14 日間の最新の天気予報を適用して、より正確な需要予測を作り出す。

確率的予測を生成

  • ポイントでの予測を生成する他の多くの予測ソリューションとは異なり、Amazon Forecast ではデフォルトで 3 つの分位点 (10%、50%、90%) の確率的予測を生成する。
  • さらに、「平均」予測を含め、1%~99%の範囲で任意の分位点を選択できる。このため、(予測を超える) 資本コストと (予測を下回る) 顧客需要のどちらを重視するかといった自社のビジネスニーズに適した予測を選択できる。

過去の時系列データを使用し、正確に予測します

  • 過去のほぼすべての時系列データ (価格、プロモーション、経済的業績指標など) を利用し、事業を正確に予測できる。
    • たとえば、小売業であれば、Forecast で機械学習を利用して時系列データ (価格、プロモーション、来店者数など) を処理し、それと関連データ (製品の特徴、陳列場所、店舗の場所など) を組み合わせ、それらの間の複雑な関係を判断する。
    • 時系列データと付加的な変動要素を組み合わせることで、機械学習を利用しない予測ツールより精度が 50% 高くなることがある。

ビジネスにとって最も重要な項目のみを予測することで、時間とコンピューティングを節約する

  • Forecast は、データセット内の項目のサブセットのみに予測を集中させることができるため、ワークフローの最適化、生産性の向上、コスト削減を実現するためのコントロールを提供する。
  • すべてのデータでモデルをトレーニングし、それを、ビジネス目標に最も重要な項目のサブセットに選択的に適用することができる。
  • これにより、運用コストやコンピューティングコストを削減し、最も重要な予測に集中することができる。

予測モデルの精度を簡単に評価

  • Forecast から与えられる 6 つの異なる包括的な精度指標は、予測モデルのパフォーマンスを理解したり、そのモデルを、以前に別の一連の変動要素や過去データにおける別の期間を利用して作成した予測モデルと比較したりするために役立つ。
  • データをトレーニングセットとテストセットに自動的に分割することで、お客様のためにテストセット用に生成された予測をダウンロードして、精度を評価するためのカスタムメトリクスを使用できる。
  • または、複数のバックテストウィンドウを作成してメトリクスを視覚化することができ、異なる開始日におけるモデルの精度を評価するのに役立つ。

Amazon Fraud Detector

  • Amazon Fraud Detector は、オンライン支払い詐欺や偽アカウントの作成など、不正の可能性があるオンラインアクティビティを簡単に識別できるようにする、フルマネージドサービス。
  • 機械学習 (ML) と AWSおよびAmazon.com の 20 年にわたる不正検出の専門知識を使用して、不正行為の可能性を自動的に特定し、より多くの不正行為を迅速に発見できるようにする
  • 数回のクリックだけで、機械学習の経験がなくても不正検出モデルを作成できる。

自動化されたモデル作成

  • 新しいアカウントの作成、オンライン支払い、ゲストのチェックアウトなどの一般的なオンラインアクティビティでの潜在的な不正行為を特定する、機械学習モデルの作成を完全に自動化。
  • 自動化されたモデル構築プロセスは、データの検証と強化、特徴エンジニアリング、アルゴリズムの選択、ハイパーパラメーターのチューニング、モデルのデプロイなどの面倒な作業をすべて処理。
  • データセットをアップロードし、モデルタイプを選択するだけで、自動的に最適な不正検出機械学習モデルを見つける。

継続的に学習するモデル

  • アカウント年齢、最後のアクティビティからの時間、およびアクティビティのカウントなどの情報を自動的に計算するので、モデルは再トレーニングの間、より長くそのパフォーマンスを維持する。これはモデルが、頻繁に取引を行う信頼できる顧客と、不正行為者の継続的な試みの違いを学習できることを意味する。

モデルパフォーマンスのインサイト

  • トレーニングした各モデルについて、提供したすべての入力を、モデルのパフォーマンスへの影響度でランキングして見ることができる。重要度の値と相対的なランキングを使用して、どの入力がモデルのパフォーマンスを促進しているかについてインサイトを得ることができる。

ルールベースのアクションをトリガーする

  • Fraud Detector の不正検出モデルを作成すると、Fraud Detector コンソールまたはアプリケーションプログラムインターフェイス (API) を使用して、モデルの予測に基づいてルールを作成することができる。
  • ルールを作成して、特定のモデルスコアの承認、確認、または詳細情報の収集などのアクションを実行できる。
    • たとえば、モデルスコアがあらかじめ設定した閾値を超えていて、アカウントの電話番号の国と IP アドレスの国が一致しない場合、疑わしいお客様アカウントに確認のためのフラグを立てるためのルールを簡単に作成できる

リアルタイム不正予測 API

  • この Amazon Fraud Detector API を利用して、リアルタイムで不正予測を実行し、アプリケーション内の発生したオンラインアクティビティを評価することができる。
    • 例えば、モデルとルールを使用してアクションをトリガーすることで、不正予測 API を呼び出して、潜在的な不正リスクについて、すべての新しいアカウントサインアップを確認できる。

予測と検出ロジックを見直し、監査するための単一インターフェイス

  • Fraud Detector コンソールを使用すると、過去の不正評価を簡単に検索および確認して、検出ロジックを監査できる。
  • イベントデータ、評価時に適用された検出ロジック、不正予測の結果となった条件を確認できる。

Amazon SageMaker の統合

  • SageMaker で不正検出モデルをすでに作成している場合、さらに多くの不正を停止するために、Fraud Detector と統合することができる。
  • アプリケーションで SageMaker モデルと Fraud Detector モデルの両方を使用して、異なるタイプの不正を検出できる。
    • たとえば、アプリケーションは Fraud Detector モデルを使用してお客様のアカウントの不正リスクを評価し、同時に SageMaker モデルを使用してアカウント侵害リスクをチェックできる。

Amazon Kendra

  • Amazon Kendra は、機械学習 (ML) を利用したインテリジェント検索サービス。
  • Kendra を使用すると、ウェブサイトやアプリケーションのエンタープライズ検索に対する考えが変わる。
  • お客様の従業員や顧客は、企業内の複数の場所やコンテンツリポジトリにコンテンツが分散して保存されている場合であっても、目的のコンテンツを簡単に見つけることができる。

インテリジェントな検索

  • Kendra は、機械学習を利用して、非構造化データからより関連性の高い回答を提供する。
    • 「健康上のメリット」などの一般的なキーワードを検索し、また「産休の期間は?」などの自然言語の質問をすると、Kendra は読解力を使って「14 週間」のような具体的な回答を出す。
    • 「VPN を設定するにはどうすればよいですか?」などのより一般的な質問については、 Amazon Kendra は、最も関連性の高い文章を抽出することにより、説明を交えた回答を出す。
  • Kendra は、よくある質問のマッチングもサポートしており、最も近い質問を特定する特殊なモデルを使用して厳選されたよくある質問から回答を抽出し、対応する回答を返す。
    • 抽出された回答とよくある質問のマッチングを補完するために、Kendra は深層学習セマンティック検索モデルを使用して正確なドキュメントランキングを提供。全体として、これにより、より豊富な検索エクスペリエンスが提供され、ユーザーに特定の回答と、より多くの情報が必要な場合に探索できる関連コンテンツが提示される。

増分学習

  • Kendra は機械学習を使用して、エンドユーザーの検索パターンとフィードバックに基づく検索結果を継続的に最適化する。
    • 例えば、ユーザーが「医療保険はどのように変更すればよいですか?」という検索を行うと、複数の人事 (HR) の福利厚生ドキュメントがトップに表示される。
    • この質問に最も関連性のあるドキュメントを決定するために、Amazon Kendra は、ユーザーの操作とフィードバックから学習して、優先ドキュメントをリストの一番上に昇格させる。
    • 機械学習の専門知識を必要とせずに、増分学習手法を自動的に適用する。

チューニングと精度

  • 検索結果を微調整し、特定のビジネス目標に基づいて特定の回答とドキュメントを結果に表示できる。
    • 例えば、関連性チューニングにより、より信頼できるデータソース、作成者、またはドキュメントの鮮度に基づいて結果の質を向上させることができる
  • 特定のビジネス用語の理解を深めるために、お客様は独自のカスタムシノニムを提供できる。Kendra はこれを使用してクエリを自動的に拡張し、拡張された語彙に一致するコンテンツと回答を含める。
    • 例えば、エンドユーザーが「HSA とは何ですか?」という質問をした場合、 Amazon Kendra は、「Health Savings Account」または「HSA」を参照するドキュメントを返す。

コネクタ

  • コネクタは、Kendra のインデックスにデータソースを追加し、コネクタタイプを選択するだけで素早く簡単に使用できる。
  • コネクタはインデックスとデータソースを自動で同期させるようにスケジュールすることができるため、ユーザーは常に最新のデータコンテンツをセキュアに検索する。
  • Kendra は、S3、Microsoft SharePoint、Salesforce、ServiceNow、Google ドライブ、Confluence などの一般的なデータソース用のネイティブコネクタを提供している。
  • ネイティブコネクタが利用できない場合、Kendra は、カスタムデータソースコネクタと、パートナーがサポートする多数のコネクタを提供する。

領域最適化

  • Kendra は、人事、企業運営、サポート、研究開発などの幅広い内部ユースケースの自然言語のクエリ、ドキュメントコンテンツ、および構造を理解するために、深層学習モデルを使用する。
  • Kendra には、IT、金融サービス、保険、医薬品、工業製造、石油/ガス、法律、メディアとエンターテイメント、旅行とホスピタリティ、衛生、ニュース、電気通信、鉱業、食品と飲料、およびオートモーティブなどの領域からの複雑な言語を理解するための最適化も行われている。
    • 例えば、人事関連の回答を検索しているユーザーが「HSA 用紙の提出期限」と入力すると、Kendra はより正確な回答を得るために検索範囲を拡大して「Health Savings Account 用紙の提出期限」も検索する。

エクスペリエンス構築者

  • コーディングや機械学習の経験がなくても、数回クリックするだけで、Kendra を使用して完全に機能するカスタマイズ可能な検索エクスペリエンスをデプロイできるようになった。
  • Experience Builder は、Kendra を利用した検索アプリケーションをクラウド上で安全かつ迅速に構築、カスタマイズ、および起動するための直感的かつ視覚的なワークフローを提供する。
  • 使用を開始する際には、ビルダーですぐに使用できる検索エクスペリエンステンプレートを利用できる。
  • このテンプレートは、フィルターや並べ替えなど、必要なコンポーネントをドラッグアンドドロップするだけでカスタマイズできる。
  • 他のユーザーを招待して、検索アプリケーションのコラボレーションやテストを行ってフィードバックを提供してもらい、該当のエクスペリエンスをデプロイする準備ができた段階でプロジェクトをすべてのユーザーと共有することができる。
  • Kendra Experience Builder は、Azure AD や Okta などの一般的な ID プロバイダーをサポートする IAM Identity Centerと統合し、検索エクスペリエンスにアクセスしながらエンドユーザーシングルサインオン認証を安全に提供することができる。

分析ダッシュボードを検索する

  • Kendra Search Analytics Dashboard を使用すると、Kendra を利用した検索アプリケーション全体の質とユーザビリティのメトリクスをより良く理解できる。
  • Analytics Dashboard は、管理者とコンテンツ作成者が、エンドユーザーが関連する検索結果をどれだけ簡単に見つけられるか、検索結果の質、およびコンテンツのギャップを理解するのに役立つ。
  • Kendra Search Analytics Dashboard は、ユーザーが検索アプリケーションをどのように操作し、検索結果がどれほど効果的であるかのスナップショットを提供。
  • 分析データは、コンソールのビジュアルダッシュボードで表示できる。あるいは、API を通して Search Analytics データにアクセスして独自のダッシュボードを作成することもできる。
    • これは、お客様が検索の傾向とユーザーの行動を詳細に確認してインサイトを取得することを可能にするとともに、改善できる可能性がある領域を明確化するのに役立つ。

カスタムドキュメントの強化

  • Kendra Custom Document Enrichment 機能を使用すると、ドキュメントが Amazon Kendra でインデックス付けされる前に、ドキュメントを前処理できるカスタム取り込みパイプラインを構築できる。
    • 例えば、コネクタを使用して SharePoint などのリポジトリからコンテンツを取り込む一方で、お客様は追加のメタデータでドキュメントを強化し、スキャンしたドキュメントをテキストに変換し、ドキュメントを分類し、エンティティを抽出し、カスタム ETL プロセスを使用してドキュメントをさらに変換できる。
  • エンリッチメントは、コンソールで設定できるシンプルなルールによって、または Lambda から関数を呼び出すことによって実行される。これらの関数は、オプションで、Comprehend、 Transcribe、Textract などの他の AWS AI サービスを呼び出すことができる。

クエリの自動補完

  • Kendra には、エンドユーザーの検索クエリを自動補完する機能が搭載されている。
  • これらの質問は通常、関連性がより高く、有益な回答につながる。
    • 例えば、「IT デスクは」と入力し始めるとすると、Amazon Kendra はクエリを補完するために「IT デスクはどこですか?」または「IT デスクは何階ですか?」などのオプションや、その他関連するよくある質問を提案する。

Amazon Lex

自然な会話

高品質の音声認識と自然言語理解

  • Lex では、自動音声認識と自然言語理解の技術を利用して、音声言語理解システムを作成できる。
  • Alexa に採用されているものと同じ、実績のある技術が使用されている。
  • デベロッパーが提供するいくつかのサンプル発話に基づいて、ユーザーが意図を表現できる複数の方法を学べる。音声言語理解システムでは、自然言語の音声とテキストによる入力を受け取り、その背景にある意図を理解し、適切な応答を呼び出すことによってユーザーの意図を実行する。

コンテキスト管理

  • 対話が発展するにつれて、発話を正確に分類できるようにするには、マルチターンの対話全体でコンテキストを管理する必要がある。
  • Lex はコンテキスト管理をネイティブにサポートしているため、カスタムコードを必要とせずにコンテキストを直接管理できる。
  • 最初の前提条件のインテントが満たされると、関連するインテントを呼び出すための「コンテキスト」を作成できる。
    • これにより、ボットの設計が簡素化され、対話体験をより素早く作成できる。

8 kHz テレフォニーオーディオのサポート

  • Lex 音声認識エンジンは、テレフォニーオーディオ (サンプリングレート 8 kHz) で訓練されており、テレフォニーのユースケースにおける音声認識精度が向上している。
  • Lex を使用して会話ボットを構築すると、8 kHz のサポートにより、コンタクトセンターアプリケーションやヘルプデスクなどの電話による音声対話の忠実度が向上する。

複数回にわたるダイアログ

  • Lex ボットでは、複数回にわたって対話を行うことができる。
  • インテントが特定されると、ユーザーは、そのインテントを実行するために必要な情報の入力を求められる
    • (例えば、インテントが "ホテルの予約" である場合、ユーザーは場所、チェックインの日付、宿泊日数などの入力を求められます)
  • Lex を使用すると、チャットボットとの複数回にわたる対話を簡単に構築できる。
    • ボットユーザーから収集するスロットやパラメータ、およびそれに対応するプロンプトを指定するだけで、Amazon Lex は適切なスロットの入力を求めて、対話を編成する

ビルダーの生産性

Visual Conversation Builder

  • Lex コンソールの Visual Conversation Builder は、ボット構築を加速させるドラッグアンドドロップ式の会話ビルダー.
  • 会話ノードを接続するだけで、コードレスな環境で簡単に会話設計を繰り返し、テストすることができる。
  • 洗練された自然な自動インタラクションを素早く構築し、会話の意図を一目で確認でき、変更が加えられた時に視覚的なフィードバックを得ることができるように、あらゆるユーザーを支援する。

強力なライフサイクル管理機能

  • Lex を使用すると、作成するインテント、スロットタイプ、ボットにバージョニングを適用できる。
  • バージョン管理とロールバックのメカニズムにより、複数のデベロッパーが作業する環境でテストやデプロイを行う際に、コードを簡単に維持管理できる。
  • Lex の各ボットに複数のエイリアスを作成し、それぞれに異なるバージョン ("本番"、"開発"、"テスト" など) を関連付けることができる。
  • これにより、ボットに継続的な改善と変更を加え、1 つのエイリアスで新しいバージョンとしてリリースすることができる。これにより、新しいバージョンのボットがデプロイされたときにすべてのクライアントを更新する必要がなくなる。

複数のプラットフォームへの 1-Click デプロイ

  • Lex を使用すると、ボットを Lex コンソールから直接チャットサービスに簡単にパブリッシュできるため、マルチプラットフォーム開発に必要な労力を削減できる。
  • リッチフォーマット機能は、Facebook Messenger、Slack、Twilio SMS などのチャットプラットフォーム用にカスタマイズされた直感的なユーザーエクスペリエンスを提供する。

ストリーミング会話

  • 自然な会話は一時停止と中断によって終結される。
    • たとえば、発信者は、請求書の支払いを提供するときにクレジットカードの詳細を得るための質問に答える前に、必要な情報を調べながら会話を一時停止するか、回線を保持するように要求する場合がある。
  • ストリーミング会話 API を使用すると、ボットを構成するときに会話を一時停止し、直接中断処理を行える。
  • 仮想コンタクトセンターエージェントまたはスマートアシスタントの会話機能をすばやく強化できる。

AWS のサービスの統合

Amazon Kendra との統合

  • カスタマーサービスの会話には、特定の質問に答えるための特定の情報を見つけることがよくある。
  • Kendra は、機械学習を利用した高精度で使いやすいインテリジェントな検索サービスを提供する。
  • Kendra 検索インテントを追加して、構造化されていないドキュメントやよくある質問から最も正確な回答を見つけることができる。ボット定義の一部としてインテントで検索インデックスパラメータを定義するだけで、その情報機能を拡張できる。

Amazon Polly との統合

  • Amazon Polly は、文章をリアルな音声に変換するサービス。
  • テキスト読み上げができるアプリケーションを作成できるため、まったく新しいタイプの音声対応製品を構築できる。
  • Polly を使用して、音声対話でユーザーに対する応答を行える。Polly は、標準 TTS 音声に加えて、新しい機械学習アプローチによる音声品質の高度な改善を実現するニューラルテキスト読み上げ (NTTS) 音声を提供する。

AWS Lambda との統合

  • Lex ではLambda との統合がネイティブでサポートされており、データ取得、更新、およびビジネスロジックの実行に活用できる。
  • サーバーレスのコンピューティング性能を生かして、ボットの開発に注力しながら、大規模なビジネスロジックを簡単に実行できる。
  • Lambda を使用して、既存のエンタープライズアプリケーションやエンタープライズデータベースと簡単に統合することも可能。
  • 統合用のコードを記述するだけで、必要な場合に AWS Lambda からコードが自動的に実行され、外部システムとの間でデータの送信や取得を行えるようになる。また、AWS のさまざまなサービスを利用して、例えば Amazon DynamoDB で会話の状態を維持したり、Amazon SNS でエンドユーザーに通知を行ったりすることができる

コンタクトセンターの統合

Amazon Connect

  • Lex は、AWS のオムニチャネルクラウドコンタクトセンターである Connect とネイティブに統合されており、デベロッパーはチャットや電話による顧客の問い合わせを処理できる会話ボットを構築できる。
  • API を使用して、あらゆるコールセンターアプリケーションに Lex を統合できる。

Genesys Cloud CX

  • Genesys Cloud CX は、以下を統一できる複数のチャネルで顧客とエージェントの体験を統一するクラウドコンタクトセンターソリューション
    • 電話
    • テキスト
    • チャット
  • Genesys Cloud プラットフォーム上に音声やテキストのボットをデプロイすることで、セルフサービス体験を可能にし、顧客エンゲージメントを向上させることができる。

Amazon Chime SDK

  • Chime SDK はリアルタイムの通信コンポーネントのセットで、これを使用して、デベロッパーは音声通話、ビデオ通話、画面共有機能を独自のウェブ、モバイル、またはテレフォニーアプリケーションにすばやく追加できる。
  • Chime SDK は Lex と統合されており、音声通信にセッション初期化プロトコル (SIP) を使用するコンタクトセンターで、Lex を利用した対話体験を簡単に実現することができる。

AWS Contact Center Intelligence (CCI)

  • Amazon Lex は複数の AWS CCI パートナーによって使用されているため、セルフサービスのカスタマーサービス仮想エージェント、情報ボット、またはアプリケーションボットをシームレスに作成できる。
  • Amazon Lex のパートナーには、Infosys、Quantiphi、Xapp.ai が含まれている。

Amazon Personalize

レコメンデーションの作成

ユーザーセグメンテーション

  • Personalize はインテリジェントなユーザーセグメンテーションを提供し、マーケティングチャネルを通じてより効果的なプロスペクティングキャンペーンを実行。
  • 2つの簡単な recipe を使用すれば、さまざまな製品カテゴリやブランドなどへの関心に基づいて、ユーザーを自動的にセグメント化できる。
    • 「aws-item-affinity」は、映画、楽曲、商品などの個別項目への関心に基づいてユーザーを識別する。
    • 「aws-item-attribute」は、ジャンルや料金など、関心のある属性に基づいてユーザーを識別する。
    • インテリジェントなユーザーセグメンテーションは、マーケティングキャンペーンへのエンゲージメントを高め、的を絞ったメッセージングを通じて顧客維持率を増やし、マーケティング費用の投資収益率を改善することができる。

ドメイン最適化レコメンダー

  • 小売、メディアとエンターテインメントなどの業界での一般的なユースケースに合わせてカスタマイズされたレコメンデーションにより、高性能で個別化されたユーザーエクスペリエンスを迅速かつ容易に提供することができる。
  • 以下のようなユースケースから選択できる。
    • 「よく一緒に購入されている商品」
    • 「今トレンドのもの」
    • 「Xをご覧になった」
    • 「厳選情報」
  • ビジネスニーズに適したレコメンダーにデータをマッピングすると、Personalize がユースケースに最適な設定を選択し、個別化されたレコメンデーションの作成と維持の作業を自動化するため、市場投入までの時間が短縮される。

ユーザーのパーソナライズ

  • ユーザーの個別化 (aws-user-personalization) recipe は、すべての個別化レコメンデーションシナリオに最適化されている
  • インタラクション、アイテム、ユーザーデータセットに基づいて、ユーザーがやりとりするアイテムを予測する。
  • アイテムをレコメンドする際、自動的なアイテム探索を行い、発見とエンゲージメントを向上させる。

類似アイテムのレコメンデーション

  • ユーザーに類似アイテムを表示して、カタログの発見可能性を向上させる。
  • この機能は、新規ユーザーや未確認ユーザーのコールドスタート段階を減少させるためにも重要。
  • 類似アイテム (aws-similar-items) recipe は、指定したアイテムに類似するアイテムのレコメンデーションを生成する。
  • 類似アイテムを使用すると、顧客の以前の行動とアイテムのメタデータに基づいて、顧客がカタログ内の新しいアイテムを発見するのに役立つ。
  • 類似アイテムをレコメンドすることで、アプリケーションのユーザーエンゲージメント、クリックスルー率、コンバージョン率を向上させることができる。

パーソナライズされたランキング

  • 個別化ランキングは、特定のユーザーに対して再ランキングされたおすすめアイテムのリスト。
  • 検索結果、プロモーション、キュレートされたリストなど、順序付けられたアイテムのコレクションを持っていて、ユーザーごとに個別化された再ランキングを提供したい場合に便利。
  • Personalize は、ビジネスプライオリティを達成し、最高のカスタマーエクスペリエンスを確保しながら、ユーザーに関連しそうなものをハイライトすることを可能。

新しいアイテムのレコメンデーション

  • 適切なレコメンデーションを構築する上で最も困難な問題の 1 つは、新しいアイテムがカタログに追加されたときに正しいレコメンデーションを提供すること。
  • Personalize では、カタログに掲載されている新アイテムと既存アイテムのレコメンデーションを適切にバランスさせることで、新商品や新鮮なコンテンツに対する質の高いレコメンデーションを生成することができる。

Trending now

  • Trending Now レコメンダーは、ビデオオンデマンド領域向けで、最も速いペースで人気を集めているカタログアイテムをレコメンデーションに浮上させる。
  • トレンドの動画は、ユーザーの間で急速に人気が高まっているアイテム。
  • Amazon Personalize は、2 時間ごとにお客様のインタラクションデータを自動的に評価し、トレンドのアイテムを特定する。
  • ドメイン最適化レコメンダーを使用すると、パーソナライズされたエクスペリエンスの提供と管理に必要な時間が短縮され、ユーザーに関連したレコメンデーションを提供できるようになる。

レコメンデーションの調整

ビジネスルールとフィルター

  • ビジネスルールを適用して、最適なカスタマーエクスペリエンスを提供する。
  • Personalize は、レコメンデーションを自動的に補強することができる。
    • 例えば、最近購入したアイテムをフィルタリングしたり、ユーザーが特定のサブスクリプション層にいる場合はプレミアムコンテンツを強調したり、カルーセルの 20% がトレンドのスポーツ記事で満たされるようにしたりできる。
    • ダイナミックフィルターを使用すると、順列を個別に作成することなく、その場でフィルタールールを変更することができる。

プロモーション

  • ビジネス目標に沿ったルールに基づいて、特定のアイテムやコンテンツをプロモーションする。
  • この機能を使用すると、各ユーザーのエクスペリエンスをさらにカスタマイズするために、レコメンデーション内でプロモーションするコンテンツの割合を制御することができる。
  • Amazon Personalize は、提供されたビジネスルール内で、各ユーザーにプロモーショすべき最も関連性の高いアイテムまたはコンテンツを自動的に発見し、ユーザーのレコメンデーション内に配信する。

非構造化テキストのサポート

  • 商品説明やレビュー、映画のあらすじなどの非構造化テキストに閉じ込められた情報を解き明かし、ユーザーに関連性の高いレコメンデーションを生成する。
  • カタログの一部として非構造化テキストを提供すると、Amazon Personalize が自動的にキーとなる情報を抽出し、レコメンデーションを生成する際に使用する。
  • 対応言語は、中国語 (簡体字および繁体字)、英語、フランス語、ドイツ語、日本語、ポルトガル語、およびスペイン語を含む。

ビジネスメトリクスの最適化

  • レコメンデーションを生成する際には、ユーザーにとって何が適切か、ビジネスにとって何が重要かを考慮する。
  • レコメンデーションに影響を与える目的を、関連性に加えて定義することができる。
  • プラットフォームでの滞在時間、ユーザーエンゲージメント、利幅、収益のほか、ビジネスにとって重要と考える数値メトリクスを最大化するために使用できる。

レコメンデーションの生成

リアルタイムまたはバッチのレコメンデーション

  • Personalize は、お客様のユースケースに最も適した方法で、リアルタイムまたはバッチデータを使用する柔軟性を提供する。
    • 例えば、ウェブサイトやアプリケーションで商品やコンテンツをレコメンドする場合は、リアルタイムのデータがより適している場合がある。
      • ユーザーの意図の変化にリアルタイムで対応することにより、関連性のあるレコメンデーションを作成する。
  • バッチデータは、大規模な通知キャンペーンに適している場合がある。
    • 例えば、たくさんのユーザーやアイテムに関連したレコメンデーションを一気に計算して保存し、E メールシステムなどのバッチ指向のワークフローで使用できる。
  • Personalize は、データの更新とレコメンデーションの品質を向上させるための新しいオプションである、データの一括増分インポートをサポートするようになった。
  • データセット内の既存のデータに新しいレコードを簡単に追加することができる。

コンテキストレコメンデーション

  • 適切なレコメンデーションを提供するには、それらが表示されるコンテキストを考慮する必要がある。
  • コンテキストレコメンデーションでは、デバイスの種類、時間帯などのコンテキスト内でレコメンデーションを生成することにより、顧客により個別化された体験を提供し、レコメンデーションの関連性を向上させることが可能.

レコメンデーション効果の測定

メトリクス集計

  • カートアド、ページビュー、クリック数など、ビジネス上の目標。
  • お客様は、システムに送信されたあらゆるイベントのインパクトを計算することで、Personalize レコメンデーションのビジネス成果を測定することができる。
  • ユーザーがアクション (イベント) を完了すると、そのデータが Personalize に送信され、インパクトの合計が計算される。

Amazon Polly

シンプルで使いやすい API

  • アプリケーションに音声合成を簡単に統合可能。
  • 音声に変換するテキストを Polly API に送信するだけで、Polly からアプリケーションにオーディオストリームがすぐに返信される。
  • アプリケーションで直接ストリーミングを開始することも、MP3 のような標準的な音声ファイル形式で保存することも可能

さまざまな音声と言語を選択可能

  • Polly では、何十種類ものリアルな音声を多数の言語でサポートしているため、最適な音声を選択して、音声対応アプリケーションをさまざまな国で配信可能。
  • Polly は、標準的な TTS ボイスに加えて、より自然で人間的な声のために音声品質を向上させるニューラルテキスト読み上げ (NTTS) ボイスを提供している

ビジュアルの精度向上のための音声同期

  • Polly により、特定の文、単語、および音が発音された場合に情報を提供する追加のメタデータストリームを、簡単にリクエストできる。
  • このメタデータストリームを合成音声のオーディオストリームとともに使用して、音声と同期した顔のアニメーションや、カラオケのような単語のハイライトなどの拡張されたビジュアル機能によって、アプリケーションを構築できるようになった。

ストリーミング音声の最適化

  • Polly を使えば、アプリケーションからユーザーに、あらゆる種類の情報をほぼリアルタイムにストリーミングできる。
  • また、さまざまなサンプリングレートから選択して、アプリケーション向けに帯域幅と音質を最適化可能。Polly では、MP3、Vorbis、raw PCM のオーディオストリーム形式がサポートされている。

発話スタイル、音声の速さ、高さ、大きさの調整

  • Polly は、W3C が定めた音声合成アプリケーション向け XML ベースマークアップ言語の標準フォーマットである Speech Synthesis Markup Language (SSML) に対応しており、言い回し、強調、イントネーションのための一般的な SSML タグがサポートされている。
  • Amazon SSML のカスタムタグには、特定の音声をニュースキャスターの発話スタイルで読み上げる機能など、独自のオプションがある。
  • この柔軟性により、ユーザーの注意を引き、それを維持することのできる生き生きとした音声を作成できる。

ニュースキャスターの発話スタイル

  • Polly では、テレビやラジオのニュースキャスターが話しているかのように音声を合成可能。これは、ニュース記事を読んだり、フラッシュブリーフィングの更新を配信するのに最適である。
  • 現在、ニューキャスタースタイルは、ニューラルテキスト読み上げ機能を使用する Matthew と Joanna の声での米国英語 (en-US)、Amy の声での英国英語 (en-GB)、および Lupe の声での米国スペイン語 (es-US) を利用可能。

音声の最大継続時間の調整

  • Polly を使用すれば、時間駆動の韻律と呼ばれる機能を使って定義する最大割り当て時間に基づいて、音声の速度を自動的に調整可能。これは多くのユースケース、特にローカライズに効果的。
    • 例えば、トレーニング用の動画に米国英語の音声が埋め込まれていて、この動画をドイツ語にローカライズしたいとする。そこで、Amazon Translate を使用してテキストを翻訳し、Polly で声を翻訳するとする。
    • ローカライズされたドイツ語の音声が対応する動画のフレームに入ることが不可欠なため、ドイツ語の音声を米国英語の音声より長くすることはできない。この機能を使用すれば、吹き替え処理をさらに簡単に行うことができる。

プラットフォームとプログラミング言語のサポート

  • Polly では、AWS SDK (Java、Node.js、.NET、PHP、Python、Ruby、Go、C++) および AWS Mobile SDK (iOS/Android) に含まれるすべてのプログラミング言語がサポートされる。また、Polly では HTTP API もサポートされるため、独自のアクセスレイヤーを実装可能。

API、コンソール、コマンドラインを使用した音声合成

  • Polly には、Polly API (およびさまざまな言語固有の SDK)、AWS マネジメントコンソール、AWS コマンドラインインターフェイス (CLI) を使用してアクセス可能。コンソール、API、CLI のいずれを使用しても、Amazon Polly の機能すべてを完全に制御できる。

カスタム辞書

  • Polly のカスタム辞書 (語彙機能) を使えば、会社名、略語、外国語、新語など、特定の単語 (フランス語以外の音声で発話する際の "ROTFL" や "C'est la vie" など) の発音を変更可能。このような発音をカスタマイズするには、辞書エントリの XML ファイルをアップロード。例えば、"Nguyen" の発音をカスタマイズする場合、この XML を使用して音素を指定する。

ブランド音声

  • ブランド音声は、Amazon Polly チームと協力して、組織専用のニューラルテキスト読み上げ (NTTS) 音声を作成するカスタムエンゲージメント。
  • ブランド音声を使用すると、Amazon Connect や Alexa スキルの統合など、さまざまなユースケースで製品とアプリケーションを独自の音声 ID で差別化可能。
  • ペルソナを特定し、俳優を特定し、彼らのスピーチを記録し、最終的に音声を生成するためのモデルを構築およびトレーニングするために、プロセス全体を通してお客様と協力する。その後、音声は AWS アカウント ID で利用可能になる。

コンタクトセンターの統合

Amazon Connect

  • カスタマーコンタクトセンターを設置および管理し、あらゆる規模で信頼できるカスタマーエンゲージメントを提供するために使用される AWS のクラウドベースのコンタクトセンターソリューションである Amazon Connect とネイティブに統合されている。

Genesys Cloud CX

  • Genesys Cloud CX は、電話、テキスト、チャットなど複数のチャネルで顧客とエージェントの体験を統一するクラウドコンタクトセンターソリューション
  • 既存の Polly ボイスのいずれかを使用して音声ボットをデプロイ可能

Amazon Chime SDK

  • Chime SDK はリアルタイムの通信コンポーネントのセットで、これを使用して、デベロッパーは音声通話、ビデオ通話、画面共有機能を独自のウェブ、モバイル、またはテレフォニーアプリケーションにすばやく追加できる。
  • Chime SDK が Amazon Polly とのネイティブ統合をサポートし、ビルダーがテキストや数値データをリアルな音声に変換し、出力を電話の発信者に自動的に再生するアプリケーションを簡単に作成できる。

AWS Contact Center Intelligence (CCI)

  • Polly は複数の AWS CCI パートナーによって使用されているため、セルフサービスのカスタマーサービス仮想エージェント、情報ボット、またはアプリケーションボットをシームレスに作成可能。
  • Polly のパートナーには、Genesys、Vonage、Accenture が含まれる。

Amazon Rekognition Video

ビデオイベントをストリーミングするための主な機能

ラベル検出

  • Rekognition ストリーミングビデオイベントは、人物、ペット、パッケージなどの物体をリアルタイムで検出するための、低コスト、低レイテンシーのフルマネージドサービス。
  • Rekognition ストリーミングビデオイベントは、人物、ペット、パッケージなどの検出済み物体、境界ボックスの座標、検出されたオブジェクトの拡大画像、およびタイムスタンプを返す。目的のオブジェクトが検出されたときに、タイムリーで実用的なアラートを配信できる。

顔検索

  • Rekognition ストリーミングビデオイベントでは、お客様のライブビデオストリーミングをリアルタイムで解析して、顔を検出および検索可能。
  • Kinesis Video Streams からのストリーミングを Rekognition Video に入力として与えると、イメージのリポジトリと照らし合わせて、非常に低いレイテンシーで顔検索を実行できる。

保存されたビデオ分析の主な機能

物体、シーン、アクティビティ検出

  • Rekognition Video では、車両やペットといった物体、都市やビーチ、結婚式といったシーン、小包の配達やダンスといった動作など、何千もの対象を自動的に認識可能。
  • 検出したラベルごとに信頼スコアを取得する。
  • 「人物」や「車」などの一般的な物体の場合、物体の境界ボックスを使用すれば集計や位置特定も可能。また、Rekognition Video は「ろうそくを吹く」や「火を消す」などビデオ内の動作の中から複雑な動きを正確に識別可能。
  • こうした豊富なメタデータを使用することで、コンテンツを検索可能にしたり、それ以前のコンテンツの文脈に見合った広告を表示したりすることができる。

コンテンツのモデレーション

  • Rekognition Video は、ヌード、暴力、武器などビデオ内の不適切なコンテンツを自動検出し、各検出のタイムスタンプを表示。
  • また、信頼スコアが付いたラベルの階層リストを取得可能。
  • これには、安全でないコンテンツの下位カテゴリが記されている。
  • たとえば「Graphic Female Nudity (女性のヌード画像)」は、「Explicit Nudity (明示的なヌード)」の下位カテゴリになる。
  • 信頼スコアと詳細なラベルを使えば、さまざまな企業ルールをセットアップして、異なる市場や地域のコンプライアンスニーズに対応することができる。

テキスト検出

  • Rekognition Video は、ビデオ内のテキストを自動的に検出して読み上げるほか、検出の信頼性、位置の境界ボックスのほか、各テキスト検出のタイムスタンプを取得できる。
  • さらに、関心領域 (ROI)、単語境界ボックスサイズ、単語信頼スコアで単語を選別できる便利なオプションも追加されている。
  • たとえば、画面上のグラフィックの下 3 分の 1 に表示されているテキストのみを検出する、あるいはサッカーの試合の得点表を読みとるため画面左上のみを検出する、といったことが可能。

有名人の認識

  • Rekognition Video を使用すると、よく知られた人物がいつどこでビデオに登場するのかを検出し認識することができる。
  • タイムコード付きの出力には、有名人の名前と一意の ID、有名人の関連コンテンツを指す URL (例: 有名人の IMDB リンク) が含まれる。

顔検出と分析

  • Rekognition Video では、ビデオフレーム内で最大 100 人の顔を検出し、境界ボックスの位置を返すことが可能。さらに、検索された顔ごとに、性別、感情、推定の年齢層、笑顔かどうか、といった追加の属性を各検出のタイムスタンプと併せて得ることが可能。

顔検索

  • Rekognition Video は、顔画像のプライベートなリポジトリに照らして検索することで、ビデオ内の既知の人物を特定可能。
  • 各一致に対して類似性スコアを、同じ人物がビデオ内で特定された場合はそれぞれの時点のタイムスタンプが得られる。また、Rekognition Video はリポジトリのいずれの顔にも一致しないビデオ内の未知の人物をすべてクラスター化し、それぞれに一意の識別子をつけてタイムスタンプを返す。

人物の動線の検出

  • Rekognition Video では、各人物がビデオ内のどこを、いつ、どのように移動したかを追跡可能。また、特定された各人物に一意のインデックスをつけることができ、ビデオ内の人数を集計することが可能

Amazon Rekognition Image

ラベル検出と画像プロパティ

  • Rekognition Image は、オブジェクト、シーン、アクティビティ、およびランドマークを検出。
  • また、Rekognition Image は、主要な色を検出し、画像の明るさ、シャープネス、およびコントラストを測定。
  • これらの機能により、検索やフィルタリングのために画像ライブラリのメタデータを生成したり、画像の品質を認識したりできる。

顔認識

  • Rekognition Image により、大規模な画像のコレクションの中から似た顔を見つけることが可能。
  • 画像から検出された顔のインデックスを作成可能。
  • Rekognition Image の高速かつ正確な検索により、参照している顔と最も一致している顔が返される。

顔分析

  • Rekognition Image では、画像内の顔を見つけて、笑っているか、瞳が開いているかどうかなどの顔属性を分析できる。画像を分析すると、Rekognition Image は、検出された顔それぞれの位置と長方形のフレームを返す。

顔の比較

  • Rekognition Image を使用すると、2 つの画像の顔が同一人物である可能性を測定できる。
  • Rekognition では、類似性スコアを使用して、ユーザーをほぼリアルタイムで参照写真と照合することができる。

危険画像の検出

  • Rekognition Image により、明示的および暗示的なコンテンツを検出して、すべての画像をアプリケーションの要件に基づいてフィルタリングできる。
  • Rekognition で信頼スコアとともにラベルの階層リストが提供されるため、許可する画像をきめ細やかに制御可能。

有名人の認識

  • Rekognition Image は、有名人、注目されている人物、またはその分野で著名な人物など、何千もの個人を検出し、認識する。これにより、マーケティングやメディアのニーズに基づいて、有名人のデジタル画像ライブラリの索引付けおよび検索することが可能

TEXT IN IMAGE

  • Rekognition Image では、画像中のテキストを容易に見つけることができ、これには道路標識や車両のナンバープレート、T シャツやマグなどに書かれた文字、字幕やテレビニュースなど画面上の文字など、自然なシーンにあるテキストも含む。
  • Text in Image は、画像を分析すると認識したテキストラベルと長方形のフレームを返し、検出した単語や行のそれぞれについての信頼スコアもそれに付属する。

PERSONAL PROTECTIVE EQUIPMENT (PPE) の検出

  • Rekognition Image は、画像に映っている人物が フェイスカバー、ハンドカバー、ヘッドカバーなどの PPE を着用しているかどうか、またそれらの保護器具が、該当する身体の部分 (フェイスカバーでは鼻、ヘッドカバーでは頭、ハンドカバーでは手) を覆っているかどうかを検出できる

API、コンソール、コマンドラインを使用した管理

  • Rekognition には、Amazon Rekognition API、AWS マネジメントコンソールおよび AWS コマンドラインインターフェイス (CLI) を使用してアクセスできる。
  • コンソール、API、CLI では、Rekognition API を使用して、ラベル検出、顔分析、顔照合、顔検索を行える。
  • Lambda には Rekognition 用の設計図が用意されており、S3 や DDB といった AWS データストアでのイベントに基づいて画像分析を簡単に開始できる。

管理セキュリティ

  • Rekognition は IAMに統合されています。 IAM ポリシーを使用すれば、Rekognition API へのアクセスを制御し、アカウントへのアクセス権限をリソースレベルで管理できる。

人によるレビュー

  • Rekognition は Amazon A2Iと直接統合されているため、安全ではない画像検出の人によるレビューを容易に実装できる。
  • Amazon A2I には画像モデレーションなど一般的な機械学習のユースケース向けの人によるレビューワークフローをビルトインで提供しているため、Amazon Rekognition の予測を簡単にレビューできる。
  • Amazon A2I で、組織内のレビュー担当者のプールを使用するか、Amazon Mechanical Turk を通じて機械学習タスクをすでに実行している 500,000 を超える独立契約業者にアクセス可能。
  • AWS により品質、セキュリティ手順の順守について、AWS によりあらかじめスクリーニングされたベンダーを使用することもできる。

Amazon Rekognition Custom Labels

  • Amazon Rekognition カスタムラベルを使用すれば、ビジネスニーズに合わせた画像の物体やシーンを特定可能。
  • たとえば、ソーシャルメディアの記事から自社のロゴを検索したり、店頭で商品を特定したり、アセンブリラインで機械部品を分類したり、健康な植物と病気に感染した植物とを区別したり、動画のアニメーションキャラクターを検出したりできる。
  • 画像分析のためのカスタムモデルの開発は、取得に時間がかかる専門知識やリソースを必要とする重要な取り組みであり、多くの場合完了までに数か月かかる。さらに、多くの場合、モデルが正確な判断を下すことができるようなデータを提供するには、人間がラベル付けした画像が数千または数万必要。このデータを収集するのに数か月かかることもあり、機械学習で使用するためにはラベル付けの人員を多数用意する必要がある。
  • Rekognition カスタムラベルは、多くのカテゴリにわたる数千万の画像を用いてトレーニング済みである Rekognition の既存の機能を基に構築されている。
  • 数千の画像ではなく、ユースケースに合わせた少量のトレーニング画像セット (通常は数百枚以下) を、使いやすいコンソールにアップロードするだけ。
  • 既に画像にラベル付けがされている場合、Rekognition では数回クリックするだけでトレーニングを開始可能。
  • ラベル付けがされていない場合は、Rekognition のラベル付けインターフェイス内で直接ラベル付けをするか、Amazon SageMaker Ground Truth を使用してラベル付けができる。
  • Rekognition が画像セットからトレーニングを開始すると、わずか数時間でカスタム画像分析モデルを作成できる。その裏では、Rekognition カスタムラベルが自動的にトレーニングデータを読み込んで検証し、適切な機械学習アルゴリズムを選択して、モデルのトレーニングを行い、モデルパフォーマンスメトリクスを提供します。その後、Rekognition カスタムラベル API 経由でカスタムモデルを使用できるようになり、それをアプリケーションに統合できる。

データのラベル付けを単純化

  • The Rekognition Custom Labels コンソールは、画像のラベル付けを高速、シンプルにするためのビジュアルインターフェイスを提供する。
  • このインターフェイスでは、画像全体にラベルを適用したり、シンプルなクリック & ドラッグのインターフェイスで境界ボックスを使用することで、特定のオブジェクトを識別してラベル付けしたりすることができる。
  • または、大規模なデータセットがある場合、Amazon SageMaker Ground Truth を使うことにより大規模な画像のラベル付けを効率的に行うこともできる。

自動化された機械学習

  • カスタムモデルの構築に機械学習の専門的技術は不要。
  • Rekognition Custom Labels には、ユーザーのために機械学習を使いやすくする AutoML 機能が含まれている。
  • トレーニング画像が提供されると、Rekognition Custom Labels は自動的にデータを読み込んで検知し、適切な機械学習アルゴリズムを選択して、モデルのトレーニングを行い、モデルパフォーマンスメトリクスを提供することができる。

評価、推論、フィードバックをシンプルに

  • テストセットのカスタムモデルパフォーマンスを評価モデル予測対割り当てられたラベルの対象比較を、テストセットの全画像で見ることができる。
  • また、精密/呼び出しメトリクス、F 値、信頼性スコアといった詳細なパフォーマンスメトリクスを閲覧することも可能。
  • 画像分析のモデルをただちに使い始めることも、さらに多くの画像を反復、再トレーニングしてパフォーマンスを改善することもできる。
  • モデルの使用を開始すると、予測の追跡、間違いの修正、フィードバックデータを利用した新しいモデルバージョンの再トレーニングとパフォーマンス改善が行われる。

Amazon Textract

光学文字認識

  • 光学文字認識 (OCR) を使用して、文書 (法的文書や書籍のスキャン画像など) のスキャン画像や表現内の印刷テキスト、手書き文字、および数字を自動的に検出

フォーム抽出

  • 文書の画像内のキーと値のペアを自動的に検出し、人間の介入を必要とすることなく、コンテキストを保持
    • key-value ペアは、リンクされたデータ項目のセット
      • 例えば、文書では、「First Name」フィールドがキーで、「Jane」フィールドが値
      • この機能により、抽出したデータをデータベースにインポートしたり、アプリケーションに変数として渡したりするのが容易
      • 従来の OCR ソリューションでは、キーと値は単純なテキストとして抽出され、ハードコードされたルールが各フォームについて記述および維持されない限り、それらの関係は失われる。

テーブル抽出

  • 抽出中、Amazon Textract では、テーブル内に保存されたデータの構成が保持
    • 列や行があるテーブルを含む財務報告書や医療記録など、主に構造化されたデータで構成されている文書に役立つ。
    • 事前定義済みスキーマを使用して、抽出されたデータをデータベースに自動的にロードが可能

クエリベースの抽出

  • クエリを使用してドキュメントから抽出する必要があるデータを柔軟に指定することができる。
  • 自然言語の質問の形式で必要な情報を指定し、API のレスポンスの一部として正確な情報 (例:「John Doe」) を受け取ることができる。
  • ドキュメント内のデータ構造 (テーブル、フォーム、黙示のフィールド、ネストされたデータ) を知る必要はなくドキュメントのバージョンやフォーマットの違いについて心配する必要もない・
  • Textract Queries は給与明細、銀行明細、W-2、ローン申込書、抵当ノート、保険申請ドキュメント、保険証など、多種多様なドキュメントで事前にトレーニングされている。
  • Textract Queries が提供する柔軟性により、後処理の必要性、抽出されたデータのマニュアルレビューへの依存、機械学習モデルのトレーニングの必要性を低減する。

署名の検出

  • あらゆるドキュメントや画像上の署名を検出する機能を提供
  • これにより、小切手、ローン申込書、クレームフォームなどのドキュメント上の署名を簡単に自動検出
  • 署名の位置と関連する信頼度スコアは、API レスポンスに含まれる

手書き文字の認識

  • 医療受診報告書や雇用申込書などの多くの文書には、手書きの文字と印刷されたテキストの両方が含まれている。
  • Amazon Textract は、テキストが自由形式であるかテーブルに埋め込まれているかにかかわらず、英語で記載された文書から両方を高い信頼スコアで抽出できる。
  • 文書には、入力したテキストおよび手書きの文字が混ざって記載されていても問題ない。

請求書と領収書

  • 請求書や領収書のレイアウトは多岐にわたるため、手作業で大規模にデータを抽出するのは難しく、時間がかかる。
  • Amazon Textract は、機械学習 (ML) を使用して請求書や領収書の文脈を理解し、ベンダー名、請求書番号、商品の料金、合計金額、支払い条件などの関連データを自動的に抽出する。

身分証明書

  • 機械学習 (ML) を使用して、テンプレートや設定を必要とせずに、米国のパスポートや運転免許証などの身分証明書のコンテキストを理解できる
  • 有効期限や生年月日などの特定の情報を自動的に抽出できるだけでなく、名前や住所などの黙示的な情報をインテリジェントに識別して抽出することもできる。
  • Analyze ID を使用すると、ID 検証サービスを提供する企業や、金融、ヘルスケア、および保険業界の企業は、顧客が身分証明書の写真やスキャンデータを送信できるようにすることで、アカウントの作成、予約のスケジュール設定、求人への応募などを簡単に自動化できる。

境界ボックス

  • 抽出されたすべてのデータは、境界ボックスの座標、つまり単語、線、テーブル、あるいはテーブル内の個々のセルといった、識別されたデータの各要素を囲むポリゴンフレームとともに返される。
  • 単語または数字がソースとなる文書のどの部分から取得されたものであるのかを監査するのに役立つ
  • 検索結果が元のドキュメントのスキャンデータを提供する際にガイドを提供

調整可能な信頼度のしきい値

  • ドキュメントから情報を抽出する際、識別するすべての要素の信頼スコアが返される
  • 抽出結果をどのように使用するかについて十分な情報に基づく判断を下す
  • 例えば、税関連の記録から情報を抽出し、高い精度を確保したい場合は、信頼スコアが 95% 未満のアイテムにフラグを付けて、人間によるレビュー対象とすることができる。

人間によるレビューを組み込んだワークフロー

  • A2Iと直接統合されているため、ドキュメントから抽出された印刷されたテキストや手書きの文字の人間によるレビューを容易に実行できる。
  • 多くのテキスト抽出アプリケーションでは、信頼性の低い予測を人間がレビューして確実に結果が正しいものとなっているようにする必要がある。
  • 人間によるレビューシステムの構築には時間と費用がかかる可能性がある。A2Iは、人間によるレビューワークフローが組み込まれているため、予測を簡単にレビューできる。
  • アプリケーションの信頼度のしきい値を選択する。
    • しきい値を下回る信頼度を持つすべての予測は、検証のために人間のレビュー担当者に自動的に送信される。
  • 人間によるレビューのために送信するキーと値のペアを指定し、ランダムに選択された文書をレビューのために送信するように A2I を設定することができる
    • 組織内のレビュー担当者のプールを使用するか、Amazon Mechanical Turk を介して既に機械学習タスクを実行している 500,000 を超える独立請負業者のワークフォースにアクセスする。
  • 品質やセキュリティ手順の遵守について、AWS によりあらかじめスクリーニングされたワークフォースベンダーを使用する

Amazon Transcribe

  • 音声をテキストに変換する機能をあらゆるアプリケーションに簡単に追加できる自動音声認識サービス
  • Transcribe の機能を使用すると、音声入力を取り込み、読みやすくレビューしやすいトランスクリプトを作成し、カスタマイズで精度を向上させ、コンテンツをフィルタリングして顧客のプライバシーを確保する

Audio inputs

  • Transcribe は、ライブおよび録音されたオーディオまたはビデオ入力を処理して、検索および分析用の高品質の文字起こしを提供するように設計されている
  • 顧客の通話 (Amazon Transcribe Call Analytics) と医療に関する会話 (Amazon Transcribe Medical) を独自に理解する個別の API も提供している

Streaming & batch transcription

  • 既存の音声録音を処理したり、リアルタイムの文字起こしのために音声をストリーミングできる
  • 安全な接続を使用して、ライブ オーディオ ストリームをサービスに送信し、応答としてテキスト ストリームを受信できる

Domain specific models

  • 通話やマルチメディア動画コンテンツに合わせたモデルを選ぶ。
  • たとえば、Transcribe は、コンタクト センターで一般的な忠実度の低い電話音声に適応する。

Automatic language identification

  • 音声ファイル内の主要な言語を自動的に識別し、文字起こしを生成

Easy to read transcripts

  • 読みやすく、レビューしやすく、特定のアプリケーションに統合しやすい正確なトランスクリプトを作成できる。
  • コール トランスクリプトの分析、字幕付け、コンテンツ検索などのダウンストリーム アクティビティに向けて出力を準備する作業を行う。

Punctuation & number normalization

  • 句読点と数字の書式設定を自動的に追加するため、わずかな時間と費用で出力が手動の文字起こしの品質とほぼ一致
  • 数値は、単語の代わりに数字または「通常の形式」にも変換される

Timestamp generation

  • 各単語のタイムスタンプを返すため、元の録音で単語やフレーズを簡単に見つけたり、動画に字幕を追加できる。

Recognize multiple speakers

  • 電話、会議、テレビ番組などのシナリオを正確にキャプチャするために、発言者の変更が自動的に認識され、テキストに反映される。

Channel identification

  • コンタクト センターは、単一の音声ファイルを Amazon Transcribe に送信できる。
  • サービスは、チャネル ラベルによって注釈が付けられた単一のトランスクリプトを自動的に識別する。

Customize your output

  • 正確さが重要であり、特定のビジネス ニーズや用語に合わせてトランスクリプトをカスタマイズするための多くのオプションを提供している。
  • Transcribe は、各文に対して最大 10 の代替文字起こしも提供するため、コンテンツとドメインに適用する最適なオプションをすばやく選択できる。
  • これは、人によるインザループの字幕ワークフローに役立ちます。

Custom vocabulary

  • カスタム語彙を使用すると、基本語彙に新しい単語を追加して、製品名、技術用語、個人の名前などのドメイン固有の単語やフレーズのより正確な書き起こしを生成できる

Custom language models

  • 必要に応じて、テキストデータのコーパスを Amazon Transcribe に送信することで、ユースケースとドメイン用に独自のカスタム言語モデル (CLM) を構築してトレーニングできる。 CLM は、独自のデータを使用して音声認識の精度を高めるのに適した機能である。

User safety & privacy features

  • 顧客のプライバシーと安全を確保することは非常に重要であり、 必要に応じて、Transcribe を使用すると、デリケートな単語や聴衆にとって不適切な単語を文字起こしの結果からマスクまたは削除可能。

Vocabulary filtering

  • 語彙フィルタリングを使用して、トランスクリプトから削除する単語のリストを指定できる。
  • たとえば、冒涜的または不快な単語のリストを指定すると、Amazon Transcribe はそれらをトランスクリプトから自動的に削除する。

Automatic content redaction / PII redaction

  • 指示があれば、Amazon Transcribe は、サポートされている言語の書き起こしから機密性の高い個人を特定できる情報 (PII) を識別して編集するのに役立つ。
  • これにより、コンタクト センターは、カスタマー エクスペリエンスのインサイトとエージェント トレーニングのためにトランスクリプトを簡単に確認して共有できる。

Data Protection

  • S3 キー (SSE-S3) を使用して保存データを保護するか、独自の KMS キーを指定する。
  • Amazon Transcribe は TLS 1.2 を使用。

Amazon Transcribe Call Analytics

  • Amazon Transcribe Call Analytics を使用して、通話のセンチメントや音声の大きさなどの会話の洞察を抽出して、エージェントの生産性と顧客体験を向上させる。

Improve contact center productivity with call summarization

  • コール サマリーを生成して、エージェントが優れたカスタマー エクスペリエンスの提供に集中できるようにし、顧客との会話の重要な部分 (問題、結果、アクション アイテムなど) を自動的にキャプチャすることで、コール後の生産性を向上させる。
  • マネージャーは、やり取りのコンテキストを理解し、顧客の問題を調査するために、トランスクリプト全体を確認することなく、これらの概要をすばやく確認できる。

Extract detailed call analytics & conversation insights

  • 機械学習の力を利用して、音声からテキストへの変換および自然言語処理機能をすばやく適用して、貴重な会話の洞察を明らかにすることができる。
  • 次に、顧客やエージェントのセンチメント、検出された問題、非通話時間、中断、通話速度などの音声特性などの洞察を、インバウンドおよびアウトバウンドの通話分析アプリケーションに統合できる。
  • これにより、スーパーバイザーは潜在的な顧客の問題、エージェントのコーチングの機会、通話の傾向をより簡単に特定できる。

Improve compliance & monitoring with automated call categorization

  • 通話を大規模に監視して、会社のポリシーや規制要件への準拠を追跡する。
  • 指定した基準 (単語/フレーズ、会話の特徴など) に基づいて、独自のカスタム カテゴリを作成してトレーニングする。
  • たとえば、カテゴリ ラベルを設定して、通話の何パーセントがアップセルまたはアカウントのキャンセルであるかを確認できる。

Produce rich call transcripts

  • エージェントが過去のやり取りからの会話の詳細にアクセスできるようにする。
  • ターンバイターンのトランスクリプトは、顧客の感情、検出された問題、中断などの洞察を提供する。

Protect sensitive customer data

  • 会話には、名前、住所、クレジット カード番号、社会保障番号などの機密性の高い顧客データが含まれることがよくある。
  • Transcribe Call Analytics は、顧客が音声とテキストの両方からこの情報を識別して編集するのに役立つ。

Contact center integrations

Genesys Cloud CX
  • Genesys Cloud CX は、電話、テキスト、チャットなどの複数のチャネルにわたって顧客とエージェントのエクスペリエンスを統合するクラウド コンタクト センター ソリューション。
  • Genesys Cloud 環境から通話音声を Amazon Transcribe にストリーミングして、エージェントの生産性を向上させ、顧客とのやり取りに関する洞察を引き出すことができる。
Amazon Chime SDK
  • Amazon Chime SDK は、開発者が音声通話、ビデオ通話、および画面共有機能を独自の Web、モバイル、またはテレフォニー アプリケーションにすばやく追加するために使用できるリアルタイム通信コンポーネントのセット
Amazon Chime Voice Connector
  • SIP ベースのコンタクト センターと簡単に統合して、Amazon Transcribe を使用してユーザー属性のライブ トランスクリプトを生成できる。

Amazon Translate

幅広い言語への対応

  • 75 の言語間の翻訳をサポート(詳細

ニューラルネットワークベース

  • ディープラーニング手法を使用して、従来の統計ベースやルールベースの翻訳モデルよりも正確で流暢な翻訳を生成
  • ニューラル機械翻訳システムはニューラルネットワークに構築されており、原文のコンテキスト全体に加えて、その部分の前までに生成した翻訳を勘案し、正確さと自然さを向上

カスタマイズされた機械翻訳

  • Active Custom Translation (ACT) を使用して、機械翻訳の出力をより細かく制御
  • データ (並列データ) を Amazon Translate に持ち込んで、機械翻訳された出力をニーズに合わせてカスタマイズできるようになる。
  • ACT は、カスタム翻訳モデルの構築および維持を必要とすることなく、カスタム翻訳された出力を生成
  • 並列データは必要に応じて何度でも更新できるため、カスタマイズされた翻訳を無料で最新の状態に保つことができる
  • ACT の優れている点は、並列データのドメイン外の資料を翻訳する場合でも、機械翻訳で最高の結果が得られる

指定エンティティ翻訳のカスタマイズ

  • カスタム用語集を使用し、Amazon Translate で特定の組織、分野、業界に独自の用語や名称をいかに翻訳するかを定義できる

言語の特定

  • 言語が指定されていない場合は、自動的にこれを特定
  • 例えば、顧客によるレビューやソーシャルメディアストリームなどのユーザーが生成したコンテンツは言語コードが無い場合が良くあります。Amazon Translate は自動的に高い精度で言語を特定

バッチ翻訳とリアルタイム翻訳

  • バッチ翻訳 (翻訳する既存のテキストが大量にある場合) とリアルタイム翻訳 (コンテンツの翻訳をアプリケーションの機能としてオンデマンドで提供する場合) の両方に対応
  • たとえば、非同期バッチ TextTranslation API を使用して、大量の文書 (docx)、プレゼンテーション (pptx)、スプレッドシート (xlsx)、テキストおよび HTML ドキュメントをある言語から別の言語に大量に翻訳し、言語の障壁を越えてコンテンツを共有できる。
  • Amazon のリアルタイム TranslateText API を使用して、顧客サービスのチャット会話を即座に翻訳し、顧客サービスエージェントが国際的な顧客により良いサービスを提供

安全な機械翻訳

  • ウェブページやウェブアプリケーションと Amazon Translate サービスとの通信は、SSL 暗号化によって保護
  • 処理されたコンテンツは、このサービスを利用している AWS リージョンで非通信時に暗号化されて保存
  • 管理者は、IAM のアクセス許可ポリシーを使用して Amazon Translate へのアクセスを制御し、機密情報を安全かつ機密に保つ事ができる

AWS Panorama

Set up in minutes

  • インストールしてネットワークに接続すると、Panorama デバイスは AWS マネジメント コンソールに接続され、そこで Panorama デバイスを登録し、オンサイト カメラからのビデオ フィードを追加し、トレーニング済みの ML モデルをデプロイし、アプリケーションを数分で実行できる

Connect IP cameras

  • RTSP 対応の IP カメラをサポートしており、ONVIF 標準をサポートする IP カメラを追加できる。

Parallel multi-model multi-stream support

  • 特定の時間に複数のカメラ ストリームへの接続をサポートし、ストリームごとに複数の ML モデルの実行をサポート

Inference at the edge

  • CV アプリケーションをエッジにデプロイできるため、低レイテンシー、データ プライバシー、限られたインターネット帯域幅が懸念されるクラウドベースの機械学習を実行できる。
  • AWS Panorama は、CV を追加して、従来は人間による検査とモニタリングが必要だったタスクを自動化するための柔軟なオプションを提供する。

GPU compute

  • NVIDIA Xavier GPU が組み込まれており、使い慣れた開発とエッジでの高速な機械学習計算が可能

Edge to cloud managed service

  • エッジにある既存の IP カメラ群を簡単に検出し、Panorama デバイス全体にコンピューター ビジョン アプリケーションを作成してデプロイし、さまざまなユースケースで使用されるアプリケーションのバージョン管理とライフサイクルを管理し、プロセスを推進するためのその他の分析を行える。
  • 複数のサイトにわたる改善もすべて AWS コンソールの単一の管理インターフェイスから可能。

Flexible options for deploying CV

  • AWS およびサードパーティ開発者による構築済みアプリケーションの拡大するエコシステムをサポート。
  • 機械学習の経験がないお客様でも、AWS や サードパーティのアプリケーションを使用して、人数カウント、車両分類、ナンバープレート認識などをすぐに開始できる。また、AWS Panorama を使用すると、開発者はクラウド内のさまざまなフレームワークを使用して独自の ML モデルをトレーニングし、それらをすばやく最適化してエッジで高速かつ正確に実行できる。

参考

9
14
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
14