Runtime Speech Recognizerでめっちゃ簡単に音声認識して遊ぼう!!!!!!!(無料)
マーケットプレイス
Git
※git推奨
OpenAI音声文字お越しツールWhisperを使用した音声認識(マルチリンガル)がなんと無料!!!!
なんかすごい人はChatGPTでしゃべれるように!!!
(ここではやりません)
(手順ほぼこの動画に乗ってます)
作り方
上記のプラグインをマーケットプレイスからエンジンに落としてくるかプロジェクトファイルにPlaguins下に入れる方法で入れます。GitのほうはTagがそのままバージョン名なのであってるバージョンのを落としてきてください。
マケプレ版はパッケージ化した際言語ファイルが梱包されない報告が散見されており(Gitでもきちんと指定しないとなる)パッケージ化する人はGit版推奨
RuntimeSpeechRecognizerとRuntimeAudioImporter必ず両方入れてください
エンジンバージョンが違うといわれますがあってるのでYesを押せばそのままリビルドが始まります(少し時間がかかります)
言語ファイルがねーよ的なメッセージが出るので「はい」を押してください
起動したらプラグインが入っているか確認してください。
RuntimeSpeechRecognizerのwikiに移動します(Git)
Copyable nodesに移動してノードをコピーしてきます。
プロジェクトに戻ります。
LevelBlueprintかPlayer系のどこかにノードをコピーします。
今回はThirdPersonCharactorにコピー
SpeechRecognizerとCapturableSoundWaveを作成します。
適当な入力キーを出してPressedをCreaateSpeechRecognizerに
ReleasedをStopCaptureにつなげます。
SetLangageから日本語に変更します。コンパイル保存していったんBPは終了。
Plugin>RuntimeSpeechRecognizer から Model LanguageをMultilingualに変更します。
上のModel Sizeはインストールする語数みたいなやつです。あげると正確さは上がりますが認識後の変換が遅くなります。お好きなものをどうぞ
設定し終わったらSetup Language Modelを押してください
メッセージが出るので「はい」を押してください。ダウンロードが始まります。
起動してみる
エンターを押しながら「UnrealEngine最高!」といって終わったら離す。
"アンディアルエンジン最高"
精度はそこまで出ていない気がする。
マイクによっていい感じの設定がかなり違う気がするのでいろいろ試してみてください。
(ヘッドセットではSetStepSize=2500にするといい感じでした)
あと長文の方がAIなのでいいっぽいのと純粋に言語データのサイズをでかくすれば精度が上がります。
おまけ
パッケージ化した後に赤字でエラーで「言語データがないぞ!」的なエラーが出ることがあります。
その時は
All/Plugins/RuntimeSpeechRecognizer
のパスを
プロジェクト設定のパッケージ化のクックする追加アセットディレクトリ
に書いてください。(筆者はこれでいけるようになりました)
みんなも簡単に音声認識して遊ぼう!