概要
おっさんになると開発よりも会議に出るのが多いのだが、とある会社の議事録は、議論のポイントを簡略化して、大切なものを書け漏らすことが多い。
音声がそのまま議事録になれば、議論内容も課題や決定事項も漏れることがないのではないか?
と考え、Amazon Transcribeってサービスの可能性を簡単に試してみる。
今回、試すのが、Amazon Transcribe
AWSの概要には、「使用すると、開発者は音声をテキストに変換する機能をアプリケーションに簡単に追加できる」とある。
試す!
テスト用のMP3ファイルを準備。本物の会議の音声ファイルを。
※ 16kHz と 8kHz 両方のオーディオストリーム、WAV、MP3、MP4、FLAC を含む複数のオーディオエンコーディングに対応しているとのこと
S3バケット作成し、MP3を格納
Transcribe のJobを作成してみる
[Create Transcription Job]をクリック
Jobの設定で、Job名をテスト用に設定し、インプットの言語は、[日本語]を選択。
次にS3より音声ファイルを読み込むので、[s3://bucket-name/mp3ファイル名]を入力。
アウトプットもS3に出力するように選択し、[next]をクリック
optional画面が出るが、そのまま何もせずに[create]をクリック
おっ!Completeになった。
結果を見てみる。
なんとなく言いたい事がわかるところもあります…
参加者の発音が悪いのか、やっぱりよくわからないところもありますね。
ネットワーク だ よ って 話 に しか ない と 思っ た けど も によって は ま データー フレンチ の レイビー です よ と か です よ と か は ちゃんと 書い て あっ た ん です ね
元の言葉を音声から探そうと思ったんですが、どこなんだろう?!って感じで見つけられませんでした。
結論
さらっと使った範囲ですが、公演用にゆっくり話したりする場合の文字起こしは使えるなって感じです。
話者を認識させたりもできるようなので、今後、もっと試してみて最終、人が議事録とかを造る必要のないことも実現できれば
って感じですね。
面白いサービスなので、もっと色々使ってみたいですね。