この記事について
Unityの標準で用意されているDictationRecognizerを利用してみます。
動作環境
Windows10(Windows10でしか動かないそうです)
注意:設定 > プライバシー > 音声認識がオンになっていないと動きません。
Unity 2021.3.24f1
やりたいこと
今回やりたいことはゲーム内で音声を受け取ってその結果を取得してゲームに反映させるということを使用と思います。
例:メニューと発言するとUIが表示される
DictationRecognizer
DictationRecognizerはフレーズを受け取った際にその内容を返す音声認識ライブラリです。
認識するキーワードを用意するわけではないので、歪みのある表記は苦手だと思います。(一と書いて「いち」と読ませるか「はじめ」と読ませるかなど)
帰ってくる値は「仮説(Hypotheses)」と「認識(Recognition)」の2種類の文字列があります。
HypothesesとRecognition
Hypothesesは認識が甘めの文字列で、発言の途中であっても文字列を返します。
Recognitionは発言終了後に精度が高い文字列を返します。
個人的にはKeywordRecognizerとDictationRecognizerの中間的なライブラリが欲しい......
使ってみた
上のテキストがHypothesesです。
文章のとぎれとぎれで値が帰ってきているのがわかります。
下のテキストがDictationRecognizerです。
自分が読み終わった後に1秒程度間があって表示されました。