More than 1 year has passed since last update.

【AWS】Amazon Transcribeで動画の文字おこしをやってみた

Last updated at 2022-07-08Posted at 2022-07-08

こんにちは
今回の記事は、AWSのAmazon Transcribeを使って、動画の文字起こしのやり方を解説します。動画で喋っている内容を、簡単にテキストにしてみましょう。

Amazon Transcribeとは？

Amazon Transcribeとは、音声を自動で文字に変換するツールです。音声データはもちろん、動画などのデータからでも文字起こしをすることができます。
さらに、カスタマイズをすることで、製品名/専門用語/個人名などのドメイン固有の単語やフレーズのより正確な文字起こしを生成できます。

詳しくは、こちらのドキュメントをご覧ください。
参考:Amazon Transcribe

Amazon Transcribeで文字起こしをやってみる

では、早速、Amazon Transcribeを使って、動画の文字起こしをやってみましょう。手順としては、以下の通りです。

S3の作成
S3で動画をアップロードする
TranscribeでJopを作成する
動画で喋っている内容がテキストに

さらに詳しく解説します！

S3の作成

まず、S3でバケットを作成します。動画をアップロードするための入れ物だと考えてください。
S3のコンソール画面から、「バケットを作成」をクリックします。

名前は任意の名前を付けます。リージョンはTranscribeと同じリージョンならばどこでも良いです。今回は、東京に設定しています。

その他の設定は、デフォルトのままで問題ありません。画面の下部に移動して、「バケットを作成」をクリックします。

S3で動画をアップロードする

　次に、文字起こしをしたい動画をアップロードします。先ほど作成したS3に動画をアップロードしましょう！
ローカルのファイルから、そのままドラッグアンドドロップでアップロードできます。

ここまでで、S3の設定が完了です。

TranscribeでJopを作成する

先ほどまで、S3に動画をアップロードする方法について解説しました。ここからは、Amazon Transcribeを使って、動画の文字起こしをやっていきます。まず、"transcribe"と検索して、設定画面を開きます。

設定画面左のメニューバーから「Transcription jobs」をクリックします。

そして「Create job」をクリックします。

Jopの設定

ここからは、Jobの設定を行います。まず、名前を適当に付けます。

次に翻訳する言語の設定です。「Specific language」にチェックをして、「Language」
は"Japanese,JP(ja-JP)を選択します。そして、「Model type」には"General model"にチェックをします。

次に、翻訳する動画を選択します。

Input dataの「Browse S3」をクリックします。

そして、先ほどアップロードした動画をクリックします。

残りの設定は、全てデフォルトのままで大丈夫です。画面下部に移動し、「Next」をクリックします。

次のページの"Configure job - optional"も全てデフォルトのままで、「Create job」をクリックします。