はじめに
AWSのAIサービスを勉強するためにBlack Belt Online Seminerを視聴したので内容をまとめます。
背景
本記事はAWSソリューションアーキテクトプロフェッショナルに合格するために、Udemyの模擬試験を解いて分からなかった部分を勉強してまとめるものです。
試験対策用のため、分からない知識を補足したり試験で問われなさそうなところを省略したりしながらまとめています。
なるべくわかりやすい記載を心がけますが、最終目的は自己学習用であるということをご容赦ください。
セミナーの内容
- AIサービスは、データを用意するだけでAPIから機械学習を利用できる。(EC2インスタンスを必要としない)
- 利用する機械学習は、AWSによって最適な実装がされている。
Amazon Recognition
画像・動画の認識サービス。
それぞれAmazon Recognition Image, Amazon Recognition Videoに分かれる。
主な機能
- 物体、シーン、アクティビティ検出、
- 顔分析
- 動線の検出
- 顔認識
- 安全でない(不適切な)コンテンツの検出
- 有名人の認識
- 画像中のテキスト認識
- リアルタイム分析
Amazon Textract
PDF、画像のテキストと構造情報を抽出するマネージドサービス。
テキスト、フォーム、テーブルの抽出が可能。
検出結果はJSON形式で出力される。
Amazon Polly
テキストを音声に変換する音声認識サービス。
Amazon Transcribe
音声をテキストに変換する音声認識サービス。
Amazon Translate
言語間でテキストを翻訳するためのニューラル機械翻訳サービス
Amazon Comprehend
機械学習を使用してテキストの理解に有用な情報を発見、分析する自然言語処理サービス。
キーフレーズ、感情分析、構文、エンティティ、トピックモデル、言語検出を抽出。
Amazon Lex
音声やテキストを使用して対話型インターフェース(チャットボット)を構築するサービス。
Alexaと同じ会話エンジンを活用して高性能の音声認識および言語理解が可能。
Amazon Personalize
ユーザー向けにパーソナライズされたレコメンデーションするための機械学習サービス。
Amazon Forecast
過去の履歴から将来を予測する時系列データ予測サービス
まとめ:全体像
種類 | サービス | 概要 |
---|---|---|
静止画・動画認識 | Recognition Image Recognition Video Textract |
画像認識 動画認識 テキスト認識 |
音声処理 | Polly Transcribe |
テキスト -> 音声 音声 -> テキスト |
チャットボット | Lex | 対話型インターフェース |
時系列データ予測 | Forecast | 過去の履歴から将来を予測 |
レコメンデーション | Personalize | 機械学習でユーザーごとに レコメンデーションする |
おわりに
各サービス概要しか記載していませんが、セミナーでは主な機能やユースケース、システムの構成例も紹介していました。試験対策を進めていくうちに必要であれば記載を充実させていきます。