目的
SpeechRecognitionを使って、文字起こしをしてみたかったので、試してみました。
開発環境
Python version:3.9.7
OS: windows 10.0
Anaconda:conda 4.11.0
ライブラリのインストール
SpeechRecognitionとpyaudioをインストールします。
SpeechRecognitionは、音声入力のライブラリ、pyaudioは、マイクロホンのからの入力に必要です。
SpeechRecognitionのインストール
SpeechRecognitionをインストールします。
pip install SpeechRecognition
pyaudioのインストール
pyaudioをインストールします。
pip install pyaudio
すると、下記のようなエラーが発生しました。
Collecting pyaudio
Downloading PyAudio-0.2.11.tar.gz (37 kB)
Preparing metadata (setup.py) ... done
Building wheels for collected packages: pyaudio
Building wheel for pyaudio (setup.py) ... error
error: subprocess-exited-with-error
× python setup.py bdist_wheel did not run successfully.
│ exit code: 1
╰─> [17 lines of output]
running bdist_wheel
running build
running build_py
creating build
creating build\lib.win-amd64-3.9
copying src\pyaudio.py -> build\lib.win-amd64-3.9
running build_ext
building '_portaudio' extension
creating build\temp.win-amd64-3.9
creating build\temp.win-amd64-3.9\Release
creating build\temp.win-amd64-3.9\Release\src
C:\Program Files (x86)\Microsoft Visual
このエラーですが、pythonのversionとpipでインストールするpyaudioのversionが合っていないため、生じているようです。こちらから対応するpyaudioのversionをダウンロードします。私の環境では、pythonのversionは、3.9ですので、 PyAudio-0.2.11-cp39-cp39-win_amd64.whl
を選択しました。
ファイルをダウンロードしたディレクトリに移動し、下記コマンドを入力します。
pip install PyAudio-0.2.11-cp39-cp39-win_amd64.whl
Processing c:\users\xxx\downloads\pyaudio-0.2.11-cp39-cp39-win_amd64.whl
Installing collected packages: PyAudio
Successfully installed PyAudio-0.2.11
Successfullyが出るとインストールは成功しています。
音声認識
下記サイトのプログラムをそのまま使用し、試してみました。
SpeechRecognitionを使って音声入力からテキスト化する自動議事録を作ってみた
すると、簡単に文字起こしができました。もう少し文字起こしのスピードが速くなると便利だなぁ。。
リンク
pyaudioのエラーの対処のため、こちらも参考にさせていただきました。