Help us understand the problem. What is going on with this article?

Amazon Transcribeを試してみた

twitterで「Amazon Transcribeがリリースされた」との情報をゲットしたため使ってみた。

Amazon Transcribeとは?

AWSの音声認識のサービス。音声ファイルをS3にアップロードすると、数分で自動で文字起こししてくれるサービス。

検証環境など

  • iphoneのボイスメモを利用。
  • 静かな部屋(周りに人がいないかつテレビ等も消した状態)でボイスメモの録音を実施。
  • iphoneと発言者の距離は十数cm。
  • つまり録音時の環境は良好。

結論

  • 上記環境で利用する分には文字起こしの精度は非常に高い。(認識率100%)

検証方法

  • 音声を録音する。

    • iphoneの「ボイスメモ」機能を利用し音声を録音する。
    • 音声ファイルをiphoneからPCに転送する。
  • PCでAWSマネジメントコンソールにログインする。 

    • 省略。
  • 録音した音声ファイルをS3にアップロードする。

    • バケットを作成する。(もちろん既存の物があればそれでOK。)
    • 音声ファイルをバケットにアップロードする。
    • アップロード完了したらバケットのバスをコピーしておく。
  • Amazon Transcribeのジョブを新規作成する。

    • マネジメントコンソールのトップページで「Amazon Transcribe」と入力する。
    • 当該ページが表示されたら、「Create job」をクリックする。
    • 「Job settings」「Input data」の各項目を入力する。
      • 「format(音声ファイルの形式)」に制限あり。mp3、mp4、wav、flacのみ対応。
      • 「Audio sampling rate」は音声ファイルのプロパティで確認可能なので、そこの情報をもとに記入する。※ここ間違うと、文字起こしに失敗する。 iOS の画像.jpg

    - 「Output Data」は今回すべてデフォルトのままにする。(よくわかんない)
    - 「Create」を押下。
iOS の画像-4.jpg

  • 「Status」が「In progress」から「Complete」になるまで待つ。
    iOS の画像-2.jpg

    • 「Status」が「Complete」になったら文字起こしの結果を確認する。 iOS の画像-5.jpg
      • 今回は音声ファイルも小さかったせいか1分ほどで文字起こし完了。ちゃんと認識されていますね。

今後の課題ややってみたいこと

  • 議事録作成に応用できないか実験する。
    • 職場のがやがやした環境の中で、どのくらいの精度を発揮できるか実験する。
    • もちろん、文字起こしされたテキストを構造化し直すタスクは自身でやらないといけないが…)
  • コールセンター業務に活用できないか考える。
    • コールセンター業務で音声データの録音をやってるはず。これを「Amazon Transcribe」で文字起こししして、テキストマイニングかけて、チャットボットの精度向上に役立てるとか
    • Amazon Connectと連携できないか。

つぶやき

音楽ファイルでやってみたけど、だめだった笑(あわよくば歌詞をすべて文字起こしして欲しかった)

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away