参考ページ
Speech to text
音源
LibriVox に収録されている新見南吉の「ラッパ」を使います。
ダウンロード
wget https://ia800200.us.archive.org/21/items/yonen_dowa1_um_librivox/yonendowa1_08_rappa_niimi.mp3
音源の元になったテキスト
ラツパ
プログラム
to_text.py
#! /usr/bin/python
#
import openai
from dotenv import load_dotenv
import os
import sys
file_audio = sys.argv[1]
sys.stderr.write(file_audio + "\n")
dotenv_path = '.env'
load_dotenv(dotenv_path)
API_KEY = os.environ.get("API_KEY")
openai.api_key = API_KEY
audio_file= open(file_audio, "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript)
.env
API_KEY="sk-11******************************************"
実行
スクリプト
to_text.sh
./to_text.py yonendowa1_08_rappa_niimi.mp3 > out01.json
jq . out01.json
実行結果
./to_text.sh
yonendowa1_08_rappa_niimi.mp3
{
"text": "LibriVox.orgのために録音されました。 ラッパ おじいさんは田舎に一人ぼっちで暮らしていました。 だんだん耳が遠くなったので、 都にいる息子のところへ 耳が遠くなったから よく聞こえる機械を買って送ってくれ と言ってやりました。 息子はいろいろ探したが あまり良い機械がないので ラッパを買って これを逆さまにして耳につけて ラッパの尻から聞きなさい と言ってやりました。 おじいさんはそのラッパを喜んで使っていましたが 耳はどんどん遠くなって とうとうつんぼになりました。 それでもおじいさんは あのラッパでは聞こえなくなったから もっとよく聞こえるのを 送ってくれと息子に手紙をやりました。 息子はいろいろ考えてから また前のラッパと同じラッパを送って このラッパを耳につけると 私の声が聞こえます と言ってやりました。 おじいさんはそのラッパを耳に当ててみました。 そして ああ、聞こえる、聞こえる 懐かしい息子の声が聞こえる と言って喜びました。 けれど、それはおじいさんの耳が聞いたのではありません 心が聞いたのです。 ラッパ終わり この録音はパブリックドメインです。"
}