Heroku
BOX
Watson

Watson SpeechToTextでBoxにある音声ファイルをテキスト化してみる(Ⅰ. 概要)

課題

会議の議事録を作成するために、会議中に録音した音声ファイルをもう一度聞きながら文字起こしする作業ってありませんか?私の会社では、英語の会議だと特にこの作業が発生し、議事録を書いて送るのも結構な手間になってしまいます。
ということで、この作業をWatson Speech To Textを使って、文字起こしの作業を自動化することにチャレンジしたいと思います!!

環境

  • Heroku
    • プログラム本体を動かすWebサーバーとして使います。
    • プログラムは何でも良いのですが、今回はNode.jsで作ります。
  • box
    • 会議を録音した音声ファイルとテキスト化したファイルを保存する場所として利用します。
  • Watson Speech To Text
    • Microsoft Bing Speech APIとかでも同じことできると思いますが、今回はWatsonを使いました。
  • 開発環境
    • MacBook Air (macOS Sierra)
    • Terminal
    • Atom

完成イメージ

完成イメージは、Boxに配置している音声ファイルを選択し、右クリックメニューから「日本語テキスト化」をクリックすると、テキスト化されたファイルがBoxに保存されるイメージです。

image.png

構成イメージ

image.png

続き

次に、必要な環境を用意していきたいと思います。

Watson SpeechToTextでBoxにある音声ファイルをテキスト化してみる(Ⅱ.環境構築)