LoginSignup
6
1

More than 3 years have passed since last update.

Amazon Transcribe で会議の音声ファイルを起こしてみた

Last updated at Posted at 2020-03-11

概要

おっさんになると開発よりも会議に出るのが多いのだが、とある会社の議事録は、議論のポイントを簡略化して、大切なものを書け漏らすことが多い。
音声がそのまま議事録になれば、議論内容も課題や決定事項も漏れることがないのではないか?
と考え、Amazon Transcribeってサービスの可能性を簡単に試してみる。

今回、試すのが、Amazon Transcribe

AWSの概要には、「使用すると、開発者は音声をテキストに変換する機能をアプリケーションに簡単に追加できる」とある。

試す!

テスト用のMP3ファイルを準備。本物の会議の音声ファイルを。

※ 16kHz と 8kHz 両方のオーディオストリーム、WAV、MP3、MP4、FLAC を含む複数のオーディオエンコーディングに対応しているとのこと
スクリーンショット 2020-03-11 15.48.38.png

S3バケット作成し、MP3を格納

スクリーンショット 2020-03-11 15.55.02.png

Transcribe のJobを作成してみる

AWS Transcrbeへ移動
スクリーンショット 2020-03-11 15.57.42.png

[Create Transcription Job]をクリック

スクリーンショット 2020-03-11 16.56.29.png

Jobの設定で、Job名をテスト用に設定し、インプットの言語は、[日本語]を選択。
次にS3より音声ファイルを読み込むので、[s3://bucket-name/mp3ファイル名]を入力。
アウトプットもS3に出力するように選択し、[next]をクリック

スクリーンショット 2020-03-11 16.05.39.png

optional画面が出るが、そのまま何もせずに[create]をクリック

スクリーンショット 2020-03-11 16.09.29.png

[in progress]と表示されるので待つ。
スクリーンショット 2020-03-11 16.09.42.png

おっ!Completeになった。

スクリーンショット 2020-03-11 17.18.26.png

結果を見てみる。

なんとなく言いたい事がわかるところもあります…
参加者の発音が悪いのか、やっぱりよくわからないところもありますね。

ネットワーク だ よ って 話 に しか ない と 思っ た けど も によって は ま データー フレンチ の レイビー です よ と か です よ と か は ちゃんと 書い て あっ た ん です ね

元の言葉を音声から探そうと思ったんですが、どこなんだろう?!って感じで見つけられませんでした。

結論

さらっと使った範囲ですが、公演用にゆっくり話したりする場合の文字起こしは使えるなって感じです。
話者を認識させたりもできるようなので、今後、もっと試してみて最終、人が議事録とかを造る必要のないことも実現できれば
って感じですね。

面白いサービスなので、もっと色々使ってみたいですね。

6
1
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
1