はじめに
がちもとさんアドベントカレンダー4日目の記事です。
今日は、OpenAIを用いてテキストから音声合成していきます。
開発環境
- Windows 11 PC
- Python 3.11
導入
1.ライブラリのインストール
pip install openai
2.APIキーを発行してコピペ
3.プログラムの作成
from openai import OpenAI
client = OpenAI(api_key="<INSERT-YOUR-API-KEY>")
speech_file_path = "speech.mp3"
response = client.audio.speech.create(
model="tts-1",
voice="fable", # alloy, echo, fable, onyx, nova, shimmer
input="こんにちは。がちもとです。今日は、オープンエーアイでテキストから音声合成していきます!"
)
response.stream_to_file(speech_file_path)
コード解説
このコードは、OpenAIのAPIを使用してテキストから音声を合成するためのPythonスクリプトの一部です。以下に簡単に説明します。
1.openaiモジュールをインポートします。
2.OpenAI APIキーを取得し、api_keyに挿入します。
3.合成した音声を保存するためのファイルパスを指定します。ここでは、speech.mp3という名前のファイルに保存することになっています。
4.OpenAIのテキストから音声を合成するためのリクエストを作成します。modelパラメータは音声合成モデルを指定し、voiceパラメータは使用する声の種類を指定します。また、inputパラメータにはテキストを指定します。この例では、日本語の挨拶文を指定しています。
5.リクエストをOpenAIのAPIに送信し、合成された音声を受け取ります。
6.受け取った音声を指定したファイルパスに保存します。
このコードを実行することで、指定したテキストが合成されて音声ファイルとして保存されます。
実行結果
お疲れさまでした。