11
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Amazon Transcribe使ってみた

Last updated at Posted at 2018-02-13

概要

2017/11/30 AWSで文字起こしのPaaSが発表された。
https://aws.amazon.com/jp/blogs/news/amazon-transcribe-scalable-and-accurate-automatic-speech-recognition/

招待制ということでさっそく申し込んだが、いつになってもAWSから承認が降りず、すっかり忘れ去った2018/2/13にAWSからPreview使っていいよ。というメールをもらった。
スクリーンショット 2018-02-13 13.30.46.png

ちなみにGCPでは似たようなサービスが既にあり、この点においてはGCPがAWSをリードしている。

使い方

S3に音声ファイルを置く。
Amazon Transcribeがそれを読む。
自動で文字起こしされる。これだけ。

Amazon Transcribeの入力項目

スクリーンショット 2018-02-13 13.34.17.png

  1. ジョブ名を決める。
  2. S3のパスを入れる
  3. 変換元の言語を選択
  4. 音声フォーマットを選択
  5. レートを入力(必須ではない)

Amazon Transcribeの注意するところ

S3にバケットを掘る際、東京リージョンは対象外である。とりあえず米国東部(バージニア)にした。
変換元の音声は現時点で英語,スペイン語の文字起こししか対応していない。日本語は対象外。
音声ファイルはmp3,mp4,wav,flacファイルでなければならない。m4aは対象外。無理やりやってもエラーになるw
Amazon Transcribeから読めるようパーミッションを適宜設定する。

変換時間

約25分のmp3データを文字起こしするのに約25分かかった。

Output

Json形式で出力される。

11
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
11
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?