twitterで「Amazon Transcribeがリリースされた」との情報をゲットしたため使ってみた。
#Amazon Transcribeとは?
AWSの音声認識のサービス。音声ファイルをS3にアップロードすると、数分で自動で文字起こししてくれるサービス。
#検証環境など
- iphoneのボイスメモを利用。
- 静かな部屋(周りに人がいないかつテレビ等も消した状態)でボイスメモの録音を実施。
- iphoneと発言者の距離は十数cm。
- つまり録音時の環境は良好。
#結論
- 上記環境で利用する分には文字起こしの精度は非常に高い。(認識率100%)
#検証方法
-
音声を録音する。
- iphoneの「ボイスメモ」機能を利用し音声を録音する。
- 音声ファイルをiphoneからPCに転送する。
-
PCでAWSマネジメントコンソールにログインする。
- 省略。
-
録音した音声ファイルをS3にアップロードする。
- バケットを作成する。(もちろん既存の物があればそれでOK。)
- 音声ファイルをバケットにアップロードする。
- アップロード完了したらバケットのバスをコピーしておく。
-
Amazon Transcribeのジョブを新規作成する。
- 「Output Data」は今回すべてデフォルトのままにする。(よくわかんない)
- 「Create」を押下。
#今後の課題ややってみたいこと
- 議事録作成に応用できないか実験する。
- 職場のがやがやした環境の中で、どのくらいの精度を発揮できるか実験する。
- もちろん、文字起こしされたテキストを構造化し直すタスクは自身でやらないといけないが…)
- コールセンター業務に活用できないか考える。
- コールセンター業務で音声データの録音をやってるはず。これを「Amazon Transcribe」で文字起こししして、テキストマイニングかけて、チャットボットの精度向上に役立てるとか
- Amazon Connectと連携できないか。
#つぶやき
音楽ファイルでやってみたけど、だめだった笑(あわよくば歌詞をすべて文字起こしして欲しかった)