11
Help us understand the problem. What are the problem?

More than 3 years have passed since last update.

Organization

Juliusに音声ファイルを解析させる

はじめに

Raspberry Pi+Juliusで音声を認識するでは、Juliusを用いて、USBマイクから取り込んだ音声を直接解析しました。Juliusでは、オプション-input -rawfileを使用すると、音声ファイルを解析することができます。

実現方法

Raspberry Pi+Juliusで音声を認識するの「動作確認」のコマンドを下記のように変更します。

変更後のJuliusコマンド
~/julius/julius-4.4.2.1/julius/julius -C ~/julius/julius-kit/dictation-kit-v4.4/main.jconf -C ~/julius/julius-kit/dictation-kit-v4.4/am-gmm.jconf -nostrip -input rawfile

コマンドが実行され、下記のコンソールが表示されます。

### read waveform input
enter filename->

enter filename->に続いて、音声ファイル名を入力します。
音声ファイルが認識されると、次のように音声認識の結果が表示されます。
下記の例では「おはよう」という音声のファイルを解析させています。

------
### read waveform input
enter filename->ohayo.wav
Stat: adin_file: input speechfile: ohayo.wav
STAT: 17554 samples (1.10 sec.)
STAT: ### speech analysis (waveform -> MFCC)
### Recognition: 1st pass (LR beam)
............................................................................................................pass1_best:  おはよう 。
pass1_best_wordseq: <s> おはよう+感動詞 </s>
pass1_best_phonemeseq: silB | o h a y o: | silE
pass1_best_score: -2833.220215
### Recognition: 2nd pass (RL heuristic best-first)
STAT: 00 _default: 20145 generated, 2524 pushed, 298 nodes popped in 108
sentence1:  おはよう 。
wseq1: <s> おはよう+感動詞 </s>
phseq1: silB | o h a y o: | silE
cmscore1: 0.711 0.219 1.000
score1: -2865.781006

おわりに

無事に解析できました。音声ファイルを解析する場合、Juliusのデフォルトでは音声ファイルは「モノラル」「サンプリングレートが16000」である必要があります。解析対象の音声ファイルがこれら条件に合わない場合は、下記のサイトを参考にjuliusコマンドのオプションで変更するか、音声ファイルの形式を変更しましょう。

公式ドキュメント 第3章 音声データ入力
Julius 音声認識ソフト part2 録音音声認識実行

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
11
Help us understand the problem. What are the problem?