【Python】音声認識でアルファベットをカタカナとして文字起こししたい
Googleの音声認識でアルファベットをカタカナとして文字起こししたい
現在googleの音声認識を使用しているのですが、入力音声で「Z(ゼット)」や「X(エックス)」と発音した際に「ゼット」「エックス」と出力されるようにしたいです。
現在使用しているコードは以下の通りとなっています。
import speech_recognition as sr
AUDIO_FILE=outputfile
r=sr.Recognizer()
with sr.AudioFile("audio"+str(i)+".wav") as source:
audio=r.record(source)
text=r.recognize_google(audio, language='ja-JP')
print("結果:",text)
0