勉強前イメージ
音声をなんかってサービスだった気がする・・・
最近似たようなサービス調べてるから。。
調査
Amazon Transcribe とは
AWSのサービスで自動で文字起こしができるサービスです。
Amazon Transcribeは音声・動画ファイルをアップロードしてASRという音声認識の技術を使って音声をテキストに変換します。
Transcribeを使うことで音声データの文字起こしはもちろんのこと、会議の議事録や動画の字幕を作ったりもすることが出来ます。
もちろん他のAWSサービスと連携させることができ、
Amazon Connect(コールセンターシステム) と組み合わせて通話記録の文字起こしをしたりすることも出来ます。
Amazon Transcribeの使い方としては以下を行うことで文字起こしが完了します。
Transcribeで作成したファイルはJSONで出力されるようです。
- s3バケット作成
- バケットに音声・動画ファイルのアップロード
- Amazon Transcribeのjobを作成
勉強後イメージ
ややこしくなってきたからまとめる。
こんな感じかな?
- Amazon Lex → 音声やテキストを使った会話形のインタフェースを構築できるサービス
- Amazon Polly → テキストから音声に変えてくれるサービス
- Amazon Transcribe → 音声からテキストに変えてくれるサービス