LoginSignup
0
1

初心者が音声認識を触ってみた (その2)

Last updated at Posted at 2024-05-27

さて、前の記事から引き続いて、マイク入力のテストをしてみます。

マイク入力を使ったサンプルプログラムを動かしてみる

何か適当なサンプルがないか探してみると、いい感じの記事がありましたので、これを試してみます。

※ このサンプルも、前回同様にWrp_.py中でssl.wrap_socket()をコールするので、Python3.12が使えません。

音声ライブラリとして、SoundCardを使っているのでインストールします。

pip install soundcard

サンプルプログラムはGitで配布されているのでダウンロードして適当に展開します。

展開したしたフォルダに以下の内容でバッチファイルを書いて実行してみます。

run.bat
set AppKey=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
set SSL_CERT_FILE=ssl\curl-ca-bundle.crt

python main.py a=%AppKey%

実行結果

pic2024-05-27_155431.png
エラーが表示されているのですが、あっさりと動きます。

ソースコードを読むと、デバイスリストの中から"pulse"を探そうとしているのですが、Windowsにはそのようなデバイス名がないのでエラー表示となるようです。でも、この状態で既定のソース?から音声を拾っているようなので、音声ミキサとかループバックを既定にするとYoutube上とかの音声とか拾えませんかね?

余談ですが、これ、停止のやり方が分かりません(www)ので、マイクをOFFにして強制的に止めます。
pic2024-05-27_163132.png
マイク動作中は通知領域にマイクのアイコンが表示されるので、これをクリックして、、、
pic2024-05-27_160432.png
「マイクへのアクセス」をオフにするとマイクを見失うのでエラー終了します。(www)

ここまで、マイク入力をAmiVoice APIを使ってテキストに落とせることを確認しました。

最終イメージは字幕用ファイルにすることなので、前回同様にjsonをパースすれば良さそうです。

参考記事

Pythonでマイク入力の音声認識してみた - AmiVoice Teck Blog

【Python】録音と再生(SoundCard, SoundFile)

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1