学校での製作物に音声認識をさせて文字列化する、と言う機能を搭載させる為にライブラリ等を調べたところ、docomoとGoogleでAPIがあったので使って見ました。
準備
docomo音声認識API
Googleの音声認識APIを使うには以下のグループに参加必須とのこと
Chrome-dev
Google Cloud Console
docomoとGoogle Cloud Consoleサイトでアカウントの作成(サインイン)しておいて下さい。
また、Google Cloud Consoleでは新規プロジェクトを作成し、APIライブラリ検索窓から**"speech"**と入力し、APIを有効化してください。
docomoではAPIKeyの申請をすると時間帯にもよるかもしれませんが、ものの数分で発行されます。
(画像では既に有効化になっていますが参考までに。Chrome-devグループに参加するとこのAPIが出てきました)
実行結果
上の文字列がdocomoで、下がGoogleです(実験途中のプログラムだったので変な表示の仕方で申し訳ないです)
ソースコードをGitHubに上げているので、ご参考までに。
ガバガバプログラムですが、勉強途中の身なのでどうか暖かい目で眺めて下さい。
Google音声認識の方は最初の1件目を取り出しています。
レスポンスボディには、3つほど候補が出てくるので各自で改変などしてみてください。
また、録音した音声を再生するプログラムも追加しましたので、認識がうまくいかないときは音声を確認して、ノイズが入ってないかどうか確認してみてください。
誤字脱字などありましたらコメントか編集リクエストの方をお願いします。