PythonでWavファイル→音声認識
wav fileの中身でなんて喋ってる聞くのがめんどいので、pythonで文字起こししてそのテキストだけみればええやん
v2t.py
import speech_recognition as sr
r = sr.Recognizer()
def v2t(path:str) -> str:
with sr.AudioFile(path) as source:
audio = r.record(source)
return r.recognize_google(audio, language='ja-JP')
おわり.langのところいじれば日本語以外もいける
利用例