9
8

More than 3 years have passed since last update.

Amazon Transcribeを試してみた

Last updated at Posted at 2019-11-24

twitterで「Amazon Transcribeがリリースされた」との情報をゲットしたため使ってみた。

Amazon Transcribeとは?

AWSの音声認識のサービス。音声ファイルをS3にアップロードすると、数分で自動で文字起こししてくれるサービス。

検証環境など

  • iphoneのボイスメモを利用。
  • 静かな部屋(周りに人がいないかつテレビ等も消した状態)でボイスメモの録音を実施。
  • iphoneと発言者の距離は十数cm。
  • つまり録音時の環境は良好。

結論

  • 上記環境で利用する分には文字起こしの精度は非常に高い。(認識率100%)

検証方法

  • 音声を録音する。

    • iphoneの「ボイスメモ」機能を利用し音声を録音する。
    • 音声ファイルをiphoneからPCに転送する。
  • PCでAWSマネジメントコンソールにログインする。 

    • 省略。
  • 録音した音声ファイルをS3にアップロードする。

    • バケットを作成する。(もちろん既存の物があればそれでOK。)
    • 音声ファイルをバケットにアップロードする。
    • アップロード完了したらバケットのバスをコピーしておく。
  • Amazon Transcribeのジョブを新規作成する。

    • マネジメントコンソールのトップページで「Amazon Transcribe」と入力する。
    • 当該ページが表示されたら、「Create job」をクリックする。
    • 「Job settings」「Input data」の各項目を入力する。
      • 「format(音声ファイルの形式)」に制限あり。mp3、mp4、wav、flacのみ対応。
      • 「Audio sampling rate」は音声ファイルのプロパティで確認可能なので、そこの情報をもとに記入する。※ここ間違うと、文字起こしに失敗する。 iOS の画像.jpg

    - 「Output Data」は今回すべてデフォルトのままにする。(よくわかんない)
    - 「Create」を押下。
iOS の画像-4.jpg

  • 「Status」が「In progress」から「Complete」になるまで待つ。
    iOS の画像-2.jpg

    • 「Status」が「Complete」になったら文字起こしの結果を確認する。 iOS の画像-5.jpg
      • 今回は音声ファイルも小さかったせいか1分ほどで文字起こし完了。ちゃんと認識されていますね。

今後の課題ややってみたいこと

  • 議事録作成に応用できないか実験する。
    • 職場のがやがやした環境の中で、どのくらいの精度を発揮できるか実験する。
    • もちろん、文字起こしされたテキストを構造化し直すタスクは自身でやらないといけないが…)
  • コールセンター業務に活用できないか考える。
    • コールセンター業務で音声データの録音をやってるはず。これを「Amazon Transcribe」で文字起こししして、テキストマイニングかけて、チャットボットの精度向上に役立てるとか
    • Amazon Connectと連携できないか。

つぶやき

音楽ファイルでやってみたけど、だめだった笑(あわよくば歌詞をすべて文字起こしして欲しかった)

9
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
8