はじめに
こんにちは!最近Microsoft Azureエキスパートを2冠達成したフォーチュンハウスです!
久しぶりにQiita書こうと思ったらなんかイベントやってるー!!!ということで、こういうお祭りが好きな私は「音声認識APIを使ってみよう!」という楽しそうなキャッチコピーに惹かれまんまと筆をとることにしました~( ´∀` )笑
AmiVoice利用申し込み
普段はMicrosoftAzureのSpeech to Textとか使ってるんですけど、AmiVoiceさん使うの初めてなので期待と緊張で胸がいっぱいです~
精度の違いや特徴があるのか非常に気になりますね!
さっそく利用申し込みです!^^
なんとイベント用にクーポンが用意されており、2か月連続で、ひと月10時間分を無料で使わせてくださるとのこと!太っ腹!!良いですね!こうやって一般ユーザに気軽に触らせていただけるとこうやって気軽にレビューできるので助かります!
情報を入力して登録完了!
もっと登録に時間がかかるかなーと思ってましたがすんなりと登録できすぐに接続情報をいただけました!
なにやら色んなエンジンが用意されているそうで、今回は「汎用」と「医療」の2パターンを使ってみることにします。
実際にAmiVoice APIを使ってみた
サンプルアプリケーションをGithubから落とし早速README.mdを拝見、HowToが詳しく書かれていて分かりやすい!(賛辞)
JavaScriptに対応しているとのことなので私は慣れ親しんだこちらを使っていきたいと思いますー
喋ったことを文字に起こしてもらう方(Wrp)と音声データを読み込ませ文字に起こしてもらう方(Hrp)の2種類あるみたい!
喋ったことを変換して欲しいので"Wrp"を使用します!
UIが用意されていたのでAPI接続情報を登録してJavaScriptを走らせてみました
一発でAPI呼び出し成功!句読点も入れてくれることに驚きました
あとそれにしても変換が早い、あっという間にで変換されました。瞬殺です。
エンジンの違いを体験してみた
さて、「医療用」がまだ使えていないのでこちらもTryしてみましょう!
待ってましたというばかりに、家族に看護師がおりますので協力してもらいましょう!!Let’sTry!
専門用語だからか「褥瘡」と喋ってましたが一般用語の「服装」に変換されちゃいました!
では期待して「医療」用エンジンに切り替えてみます。
しっかりと認識されている!感動しました。
医療用とうたっているエンジンなだけあって専門用語がカバーできており素晴らしいですね!!!
おわり
今回触ってみたAmiVoiceAPIですが、単純に音声からテキストへの変換スピード(一瞬)と分野に特化したエンジン(医療用等)が素晴らしいなと思いました!
音声認識含むAI分野は今後も伸びていくと思われますので、まずは新技術を触ってみるをモットーにトレンドをしっかりキャッチしつつ社会に役立つ素敵なプロダクトへ組み込んでいきたいですね!(*^^)v