OpenAIでテキストから音声合成すーる（Python）

Posted at 2023-12-04

はじめに

がちもとさんアドベントカレンダー4日目の記事です。
今日は、OpenAIを用いてテキストから音声合成していきます。

開発環境

Windows 11 PC
Python 3.11

導入

1．ライブラリのインストール
pip install openai

2．APIキーを発行してコピペ

3．プログラムの作成

text2speech.py

from openai import OpenAI
client = OpenAI(api_key="<INSERT-YOUR-API-KEY>")

speech_file_path = "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="fable", # alloy, echo, fable, onyx, nova, shimmer
  input="こんにちは。がちもとです。今日は、オープンエーアイでテキストから音声合成していきます！"
)

response.stream_to_file(speech_file_path)

コード解説

このコードは、OpenAIのAPIを使用してテキストから音声を合成するためのPythonスクリプトの一部です。以下に簡単に説明します。

1．openaiモジュールをインポートします。
2．OpenAI APIキーを取得し、api_keyに挿入します。
3．合成した音声を保存するためのファイルパスを指定します。ここでは、speech.mp3という名前のファイルに保存することになっています。
4．OpenAIのテキストから音声を合成するためのリクエストを作成します。modelパラメータは音声合成モデルを指定し、voiceパラメータは使用する声の種類を指定します。また、inputパラメータにはテキストを指定します。この例では、日本語の挨拶文を指定しています。
5．リクエストをOpenAIのAPIに送信し、合成された音声を受け取ります。
6．受け取った音声を指定したファイルパスに保存します。
このコードを実行することで、指定したテキストが合成されて音声ファイルとして保存されます。

実行結果

お疲れさまでした。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up