0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Amazon Transcribeで音声の文字おこし

0
Posted at

はじめに

文字起こしのチュートリアルを実践しました。

用意されたmp3ファイルをS3に置いて、文字起こしをするようです。

S3にMP3を配置する

準備されたmp3ファイルをS3に配置してURLをコピーしておきます。

余談ですが、S3は配置したファイルをWeb上で開くことができるようになりました。mp3ファイルもS3上でダウンロードすることなく聞くことができます。

文字起こしジョブをCreateする

  1. Amazon Transcribeのコンソールを開きます。こちらはまだ日本語化されていないようです。
  2. Languageで英語(English, US (en-US)を選択し、input dataとして先ほどS3に置いたmp3ファイルを指定してそのまま次へ次へとクリックしていくとジョブが開始されます。
  3. in progressと表示されているステータスがCompleteになったところで完了したジョブをクリックして開いてみると、文字起こしされたテキストを参照することができるようになります。サンプル用のファイルを使っただけあってうまく文字起こしされているようです。
    image.png

文字起こしの結果は単語ごとにその確度が記録されており、json形式でダウンロードすることもできるようになっています。

日本語の文字起こし

そうなると気になると、今度は日本語でも使えるのか、ということです。

  1. Windowsのボイスレコーダーというアプリで、青空文庫から「坊ちゃん」の1節を録音します。ファイル名をbochan.m4aとします。
  2. 同じようにs3にアップロードしてtranscriptを行います。もちろんLanguageはJapanese, JP (ja-JP)を選択します。
  3. 58秒あるファイルですが、45秒でジョブが完了しました。結果は下記の通り。普通の単語の音はだいたい聞き取ってくれましたが、いくつか日本語的な問題は見られました。
    image.png
    1. 令和の現代ではあまり使われない「時分」や「小使い」はさすがに誤変換されている。
    2. 同級生のせりふ「弱虫やーい」は「弱虫焼いて」としているものの、確度55.21%と何かが違うような自覚あり。
    3. 句読点の位置が変。
  4. 題材がよくなかったかもしれないので今度はAWSのサイトから1節を録音して試してみました。やはり、句読点以外はほとんどOKのようです。
    image.png

おわりに

会議の議事録作り等で利用するのはまだ難しそうです。利用が増えればAIがどんどん学習して精度も上がるように思いますが、日本ではまだあまり使われていないのかもしれません。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?