LoginSignup
2
0

こんにちは!
今回はPostmanからOpenAIのAPIリクエストを送信して日本語の音声ファイルを英語スピーチに変換してみます。

使うAPIはこちら↓

  • Create translation:英語以外のオーディオファイル(flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm)を英語に変換してJSON形式のテキストで返してくれる。
  • Create speech:テキストを読み上げてオーディオファイルを返してくれる。日本語も対応している。他の対応言語はこちら

まずは、Postmanのワークスペース上にコレクションを作ります。
Screenshot 2023-12-15 at 1.29.57 pm.png

上のOpenAIのページのExample requestの横のCopyアイコンをクリックしてコピーします。
Screenshot_2023-12-15_at_1_31_11_pm.png
Postmanのワークスペースのインポートをクリックして、インポート画面を開いたらそこにペーストします。
Screenshot 2023-12-15 at 1.33.37 pm.png
Screenshot 2023-12-15 at 1.35.09 pm.png
すると、リクエストとして読み込んでくれるので、先ほど作ったコレクションに保存します。

リクエストを送るにはAPIキーが必要なので、OpenAIのダッシュボードのAPI KeysのメニューからAPIキーを作成します。
Screenshot 2023-12-15 at 1.43.18 pm.png
作成したAPIキーはコレクションの認証ページにBearerトークンとして指定します。これでコレクション内のリクエストにはこの認証方法が適用されます。
Screenshot 2023-12-15 at 1.44.57 pm.png
セキュリティの面からAPIキーは環境変数に登録することをお勧めします。環境変数だとシークレットタイプが選べます。現在値のカラムにAPIキーを入力します。
Screenshot 2023-12-15 at 2.12.29 pm.png

さて早速、適当な音声ファイルを使って試してみましょう。(サンプル音声はここから拾ってきました)
Screenshot 2023-12-15 at 1.47.25 pm.png

次にやりたいのは、この英語テキストをスピーチ(音声ファイル)にしたいので、Create speechエンドポイントを使います。先ほどと同様の方法で、OpenAIのページからExample requestをコピーしてPostmanのコレクションにリクエストを作成します。
上のCreate translationのリスポンスのテキストをCreate speechリクエストのinputプロパティに指定したいので、ここは"input_text"という変数にします。
Screenshot 2023-12-15 at 1.53.12 pm.png

さらにCreate translationリクエストのテストタブを開いてリスポンスを環境変数に設定する、というスクリプトを書きます。
Screenshot 2023-12-15 at 1.58.22 pm.png

これで完成です。Create translationリクエスト→Create speechリクエストの順でリクエストを送信することで、日本語の音声ファイルから英語スピーチを作成することができます。

完成したコレクションはこちら

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0