この記事の目的
AWSに存在する生成AI系のサービスをまとめ、学び、愛す。
文字だけだと覚えられそうになかったので一部コンソール画面を添付しています。
(Amazon Bedrock と Amazon SageMaker については関連トピックが膨大なので別途どこかでやります。)
Amazon Comprehend
テキストデータを分析できるサービス。以下のことが行える。
- 固有名詞抽出
- 文章中の固有名詞(猫とかウサギとか)を抽出する
- キーワード抽出
- 文章の中で繰り返し登場する重要な単語を抽出する
- 感情分析
- 文章全体の感情がネガティブかポジティブか普通かを判断する
- 言語
- 文章がどの言語で書かれているかを判別する
- PII
- 文章中の個人情報を抽出する
- ターゲット感情分析
- 文章中に登場する人物が何に対してどう思ったのかを分析する
- 構文解析
- 文章の構文を解析する
Amazon Comprehend Medical
Comprehend の医療特化バージョン。
文章を入力するだけで下記のような図を作成してくれる。
記されているのは患者の年齢とか性別、職業にお肌の状態、それから病歴と心拍数…もうほとんどカルテじゃん!すごい。
Amazon Fraud Detector
コンソール曰く、
Amazon Fraud Detector は、オンライン決済の不正行為や偽のアカウントの作成など、不正なオンライン活動を簡単に識別できる完全マネージド型サービスです。
公式ページの説明を読む限り、最初に不正なデータを読み込ませて、教師あり学習を施してモデルを作成した上で使用するものらしい。
Amazon Kendra
参照先データベースを指定することで、検索システムが簡単に作成できるサービス。
データベースには「Web」や「Slack」などが選べる。
検索結果やユーザーの行動により検索結果を微調整してくれるらしい。すごい。
Amazon Lex
Alexa のようなチャットボットが作れるサービス。
固有表現については「カスタム語彙」として追加が可能。
Amazon Personalize
顧客が好きそうな商品やデータを分析してくれるサービス。個人開発よりは企業向け。
ビデオ配信サイトの「ユーザーが好きそうなビデオをおススメに出す」機能や通販サイトの「この服を買ったユーザーはこの服も好きそうだな」みたいな機能に使用されている。
Amazon Polly
テキストデータを合成音声で読み上げてくれるサービス。多言語対応。声も男性女性、さらに低い声高い声で選べる。
単語の発音をカスタマイズしたりもできる。
Amazon Q
生成AIを搭載したアシスタント。
Amazon Q Business
主に企業やビジネスユーザー向け。
業務上の問題を解決してくれたりする。
Amazon Q Developer
開発者向け。
コードの提案や書き換え、テストなどをやってくれる。
Amazon Rekognition
画像分析、動画分析が行えるサービス。
以下のようなことが行える。
ラベル検出
画像に写っている物体を検出できる。
画像のプロパティ
画像の色を検出してくれる。
画像のモデレーション
画像に写っている不適切なものを検出する。
(酒、たばこ、ギャンブル、薬、ヌードなど)
顔の分析
名前の通り、顔の分析をしてくれる。
髭が生えてるか、サングラスかけてるか、笑顔なのか、女性なのか、とか。
顔の比較
顔の比較をして、同一人物かどうかの判定ができる。
顔のライブネスチェック
動いてしゃべっている顔を認識させることで、なりすましやディープフェイクの可能性を検知できる。
有名人の認識
画像に写っている有名人を識別できる。
(どの程度の知名度があれば有名人判定されるのかは不明。)
イメージ内のテキスト
画像に写っているテキストを検出してくれる。
(日本語は駄目っぽい)
PPE 検出
その名前の通り、個人保護機器を抽出してくれる。
Amazon Textract
画像データからテキストを抽出するサービス。
領収所を読み込んで、項目と費用を自動で分けて計算してくれたりする。便利。
免許書を読み込むと名前とか生年月日とかを勝手に抽出してカテゴライズしてくれる。便利。
なお、東京リージョン未対応。
Amazon Transcribe
音声データをテキストデータに変換できるサービス。
コンソール画面で試せる。
通話の記録を分析することも可能
Amazon Transcribe Medical
コンソール曰く、
Amazon Transcribe Medical は、臨床文書用の音声筆記、ファーマコビジランスの通話分析、字幕作成、遠隔医療セッション中のアクセシビリティなどのユースケース向けに正確な音声テキスト変換機能を提供します。Amazon Transcribe Medical は、さまざまな専門分野のトランスクリプションをサポートしています。これは、ストリームを開始するときに指定できます。
つまり、医学用語に特化した文字起こし。
お医者さんと患者さんが会話で問診するときとかを想定している。すごい。
生成結果をAmazon Comprehend Medicalに読み込ませることでさらに解析ができる。
Amazon Translate
リアルタイム、もしくはバッチで翻訳ができるサービス。
リアルタイムはコンソール画面からお手軽に試せる。バッチはジョブを作成してS3にファイルを配置し、それを読み込む感じ。
文章に固有の単語(ネットミームとか、わかる人にだけわかるようなやつ。)がある場合はあらかじめ登録しておくことも可能。CSV等の形式でまとめてアップロードし、暗号化もできちゃう。
リクエスト数やエラー数などメトリクスも閲覧可能。