Help us understand the problem. What is going on with this article?

日本語に対応した文字起こしサービス Amazon Transcribe がすごいらしいので試してみた

はじめに

下記の記事を読んだところ、日本語に対応した文字おこしサービス Amazon Transcribe がすごいらしいので試してみた。

Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。
https://note.com/sangmin/n/nf404e9945f48

サービスページを見てみると
1. 複数話者の認識
2. カスタム語彙
3. 語彙フィルタリング
4. 文字起こしのストリーミング
5. 120分の音声ファイルで、約2.88USD(300円くらい)

なかなかすごい。既存のインストール型文字起こしソフト(AmiVoiceやドラゴンスピーチ)も真っ青だ。

試してみる

環境

手順

おおまかな手順は以下
1. 文字起こししたい音声ファイルを、S3に保存
2. Transcribeでjobを作成し、音声ファイルを指定
3. job実行、テキスト出力

事前にS3に音声ファイルを保存し、保存したファイルパスをコピーしておく

無題のプレゼンテーション.jpg

アクセス

Amazon Transcribe
無題のプレゼンテーション.png

「Amazon Transcribe の使用を開始する」をクリック

無題のプレゼンテーション.png

「Create job」をクリック

無題のプレゼンテーション (2).png

「Name」に適当な、「Language」に、「Input file location on S3」に<事前にS3に保存した音声ファイルパス>を入力、選択し「next」クリック

無題のプレゼンテーション (3).png

optional画面が出るが特に設定せず、「Create」をクリック

無題のプレゼンテーション (6).png

「Transcription jobs」画面に戻り、「Status」が「In progress」に変更されていれば文字起こし実施中。「Status」が「Complete」になれば文字起こし完了。job名をクリック

無題のプレゼンテーション (8).png

「Download full transcript」をクリックし文字起こしファイルをダウンロード

無題のプレゼンテーション (9).png

文字起こしファイルはjsonでダウンロードされるため、適当なメモ帳などのテキスト編集ソフトで開く

無題のプレゼンテーション (10).png

実際に使ってみて

  • 2時間18分の音声ファイルを約20分で文字起こし完了した。
  • S3に音声ファイルをアップロードする時間を合わせても30分以内で完了した。
  • 変換精度はまあまあ、手動での修正が必須。
  • 変換されたファイルには文字と文字の間に半角スペースが入っていてそのままでは使えない。 例)ガードレール 付き まし て は い て 一つ の 考え として は その いわゆる その 装甲 車両 も 含め た 走行 と それぞれ の 観客 エリア が はっきり 分かれ た 方 が いい って こと も あり ます ので

終わりに

思った以上に日本語の変換精度は高くなく、変換後に人による全文チェックは必須のレベル。
そのため現状ではAmivoiceなど既存の文字起こしソフトウェアに分があるように思える。
が、変換速度と価格は既存ソフトの価値を破壊するレベルであり、変換精度もこれから急に上がっていくと思われるとうかうかしていられない。
もう少しこなれてきた頃にもう一度試してみたい。

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした