LoginSignup
3
3
音声認識APIを使ってみよう!

無料クーポン2か月で音声認識API(AmiVoice)使ってみた!!(*^^)v

Posted at

はじめに

こんにちは!最近Microsoft Azureエキスパートを2冠達成したフォーチュンハウスです!
久しぶりにQiita書こうと思ったらなんかイベントやってるー!!!ということで、こういうお祭りが好きな私は「音声認識APIを使ってみよう!」という楽しそうなキャッチコピーに惹かれまんまと筆をとることにしました~( ´∀` )笑
image.png

AmiVoice利用申し込み

普段はMicrosoftAzureのSpeech to Textとか使ってるんですけど、AmiVoiceさん使うの初めてなので期待と緊張で胸がいっぱいです~
精度の違いや特徴があるのか非常に気になりますね!
さっそく利用申し込みです!^^
image.png
なんとイベント用にクーポンが用意されており、2か月連続で、ひと月10時間分を無料で使わせてくださるとのこと!太っ腹!!良いですね!こうやって一般ユーザに気軽に触らせていただけるとこうやって気軽にレビューできるので助かります!

image.png

情報を入力して登録完了!
もっと登録に時間がかかるかなーと思ってましたがすんなりと登録できすぐに接続情報をいただけました!
スクリーンショット 2024-05-11 22.53.55.png
なにやら色んなエンジンが用意されているそうで、今回は「汎用」と「医療」の2パターンを使ってみることにします。
スクリーンショット 2024-05-11 22.56.00.png

実際にAmiVoice APIを使ってみた

サンプルアプリケーションをGithubから落とし早速README.mdを拝見、HowToが詳しく書かれていて分かりやすい!(賛辞)
JavaScriptに対応しているとのことなので私は慣れ親しんだこちらを使っていきたいと思いますー

スクリーンショット 2024-05-11 23.28.17.png

喋ったことを文字に起こしてもらう方(Wrp)と音声データを読み込ませ文字に起こしてもらう方(Hrp)の2種類あるみたい!
喋ったことを変換して欲しいので"Wrp"を使用します!
スクリーンショット 2024-05-11 23.32.58.png

UIが用意されていたのでAPI接続情報を登録してJavaScriptを走らせてみました
一発でAPI呼び出し成功!句読点も入れてくれることに驚きました
あとそれにしても変換が早い、あっという間にで変換されました。瞬殺です。
スクリーンショット 2024-05-11 23.49.15.png

エンジンの違いを体験してみた

さて、「医療用」がまだ使えていないのでこちらもTryしてみましょう!
待ってましたというばかりに、家族に看護師がおりますので協力してもらいましょう!!Let’sTry!
スクリーンショット 2024-05-11 22.46.54.png

専門用語だからか「褥瘡」と喋ってましたが一般用語の「服装」に変換されちゃいました!
では期待して「医療」用エンジンに切り替えてみます。
スクリーンショット 2024-05-11 22.45.10.png
しっかりと認識されている!感動しました。
医療用とうたっているエンジンなだけあって専門用語がカバーできており素晴らしいですね!!!

おわり

今回触ってみたAmiVoiceAPIですが、単純に音声からテキストへの変換スピード(一瞬)と分野に特化したエンジン(医療用等)が素晴らしいなと思いました!
音声認識含むAI分野は今後も伸びていくと思われますので、まずは新技術を触ってみるをモットーにトレンドをしっかりキャッチしつつ社会に役立つ素敵なプロダクトへ組み込んでいきたいですね!(*^^)v

image.png

おまけ

サービス(ラインナップ)の違い

image.png

エンジン一覧

image.png

3
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
3