More than 5 years have passed since last update.

【Unity】音声認識エンジンについて調べてみた

Last updated at 2017-10-08Posted at 2017-04-05

多種多様な音声認識エンジン

Web Speech API

精度が高く、資料が豊富で導入し易い
単語辞書も不要なので自由な会話に向いていますがレスポンスが少々遅いです。

下記の資料で丁寧に解説されています。
筆者はオレオレSSL証明書で少し躓いたので
知らない用語を補足しながら読み進めると良いと思います。
[Chrome の音声認識を Unity で利用してみた]
(http://tips.hecomi.com/entry/20131202/1386004185)
[OpenSSL]
(https://www.openssl.org/)
[Apache/SSL自己証明書の作成とmod sslの設定]
(http://www.maruko2.com/mw/Apache/SSL%E8%87%AA%E5%B7%B1%E8%A8%BC%E6%98%8E%E6%9B%B8%E3%81%AE%E4%BD%9C%E6%88%90%E3%81%A8mod_ssl%E3%81%AE%E8%A8%AD%E5%AE%9A)

Intel RealSense SDK

精度が高く、資料が豊富で導入し易いが日本語で躓いた
英語での音声認識は高い精度で出来ました。
日本語の音声認識モジュールは数十時間インストールしようと試みましたが
インストール出来なかったため未検証です。
RealsenseSDKで音声認識した結果をUnityで使う

UnityEngine.Windows.Speech

精度が高く、ゲームとの相性が良い
Unityの音声認識APIなので手軽に利用出来て精度も高いです。
[VRアプリで使える音声コマンドを簡単に実装してみる
（Oculus Rift CV1 + Windows10)]
(http://qiita.com/decchi/items/c9ae04b049ace49f91bc)

Julius

ゲームとの相性は良いが精度を上げるためには慣れが必要
限られたキーワードを利用するだけならばあまり不便は無いと思います。
Julius で音声認識させてみた
[Unityで音声認識]
(https://www.slideshare.net/hamayanhamayan/unity-54349052)
[MMDAgent(Julius)の音声認識率を上げる方法]
(http://deg-nico.seesaa.net/article/304283044.html)
[Unity から音声認識ライブラリ JuliusLib を使うためにやったこと]
(http://qiita.com/chiepomme/items/b67631bb61447592e3bb)

その他

Cortana
Wit.ai
IBM Watson Speech to Text
Speech-to-Text
DragonSpeech

[Unity公式アセット「Speech-to-Text」の概要と基本的な使い方をまとめました]
(http://magicbullet.hatenablog.jp/entry/UnityAsset_Speech-to-Text)

まとめ

下記のように目的に応じて使い分けると良いと思います。

自由な会話ならWeb Speech APIやIntel RealSense SDK
限られたキーワードを利用するだけならUnityEngine.Windows.SpeechやJulius

利用目的は先人様が何人もいらっしゃいますが

VRゲームでの入力手段として
ボイスロイドを利用して実況するため
雑談APIと会話をするため

などで利用していこうと考えております。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up