こんにちは
今回の記事は、AWSのAmazon Transcribeを使って、動画の文字起こしのやり方を解説します。動画で喋っている内容を、簡単にテキストにしてみましょう。
Amazon Transcribeとは?
Amazon Transcribeとは、音声を自動で文字に変換するツールです。音声データはもちろん、動画などのデータからでも文字起こしをすることができます。
さらに、カスタマイズをすることで、製品名/専門用語/個人名などのドメイン固有の単語やフレーズのより正確な文字起こしを生成できます。
詳しくは、こちらのドキュメントをご覧ください。
参考:Amazon Transcribe
Amazon Transcribeで文字起こしをやってみる
では、早速、Amazon Transcribeを使って、動画の文字起こしをやってみましょう。手順としては、以下の通りです。
- S3の作成
- S3で動画をアップロードする
- TranscribeでJopを作成する
- 動画で喋っている内容がテキストに
さらに詳しく解説します!
S3の作成
まず、S3でバケットを作成します。動画をアップロードするための入れ物だと考えてください。
S3のコンソール画面から、「バケットを作成」をクリックします。

名前は任意の名前を付けます。リージョンはTranscribeと同じリージョンならばどこでも良いです。今回は、東京に設定しています。

その他の設定は、デフォルトのままで問題ありません。画面の下部に移動して、「バケットを作成」をクリックします。

S3で動画をアップロードする
次に、文字起こしをしたい動画をアップロードします。先ほど作成したS3に動画をアップロードしましょう!
ローカルのファイルから、そのままドラッグアンドドロップでアップロードできます。

ここまでで、S3の設定が完了です。
TranscribeでJopを作成する
先ほどまで、S3に動画をアップロードする方法について解説しました。ここからは、Amazon Transcribeを使って、動画の文字起こしをやっていきます。まず、"transcribe"と検索して、設定画面を開きます。

設定画面左のメニューバーから「Transcription jobs」をクリックします。
Jopの設定
ここからは、Jobの設定を行います。まず、名前を適当に付けます。

次に翻訳する言語の設定です。「Specific language」にチェックをして、「Language」
は"Japanese,JP(ja-JP)を選択します。そして、「Model type」には"General model"にチェックをします。

次に、翻訳する動画を選択します。

Input dataの「Browse S3」をクリックします。

そして、先ほどアップロードした動画をクリックします。

残りの設定は、全てデフォルトのままで大丈夫です。画面下部に移動し、「Next」をクリックします。

次のページの"Configure job - optional"も全てデフォルトのままで、「Create job」をクリックします。

動画で喋っている内容がテキストに
Jobの作成後、数分経つと、Statusが「Success」に変化します。

動画で喋っている内容が文字に起こされていることがわかります。

このようにAmazon Transcibeを使うと、簡単に動画の文字起こしができます。
最後に
今回の記事は、AWSのAmazon Transcribeを使って、動画の文字起こしのやり方を解説しました。
弊社では、一緒に働いてくれるエンジニアを募集しています。
↓最新技術や自社開発に興味のある方はこちらから↓
Wantedly - スタジオアンビルト株式会社
こんなWebサービスを作っています。
・マドリー
・Studio Unbuilt


