以下のポストでお知らせがされていた、音声合成/TTS(Text-to-Speech)ができる「Aivis Cloud API のベータ版」をさっそく試したので、その手順のメモです。
上記ポストにあるとおり、記事執筆時点では「《🆓 当面の間は無料でお使いいただけます!》」とのことです。
試した手順
早速、手順の話です。
APIキーの取得
まずは、APIキーを取得します。その際、もしアカウントを持っていない場合は、アカウントの作成も必要です。
そしてキーの作成は、アカウントにログインした状態でこちらにアクセスして行います。
●API キー管理 | Aivis Cloud API ダッシュボード
https://hub.aivis-project.com/cloud-api/api-keys
以下のように、自分で何らか名前を決めた APIキーを作成できました。
簡単にお試しができるデモページ
APIキーを取得した後は、以下のデモページで簡単に試せるようです。
●リアルタイム音声合成デモ | Aivis Cloud API
https://api.aivis-project.com/v1/demo/realtime-streaming
とりあえず、特定の文章を特定の音声モデルで読み上げた時の、音声の内容を確かめるにはこのデモページを使うのが手軽でした。
必要な内容の入力など
音声合成の音声モデルを決める「モデル UUID」は、デフォルトで入力がされているようなので、とりあえずデフォルトのものを使ってみます。
以下の赤矢印で示した「APIキー」というボックスは自分で取得した APIキーを入力する必要があります。APIキーを入力したら、あとは「生成するテキスト」の部分を適宜書きかえるなどして、画面下のボタンを押せば音声合成が行われます。
試してみたところ、レスポンスはかなり良い感じで、音声合成が行われました。
モデル UUID を変える
上記のデモページにある「モデル UUID」について、「検索はこちら」と書かれたリンク先の情報を少し紹介してみます。
●音声合成モデルを検索 | AivisHub - AivisSpeechで使えるAI音声合成モデル共有サイト
https://hub.aivis-project.com/search
ページを開くと、こんな感じの音声モデル一覧が表示されます。
その中の 1つを適当に選んでみます。
●にせ | AivisHub - AivisSpeechで使えるAI音声合成モデル共有サイト
https://hub.aivis-project.com/aivm-models/6d11c6c2-f4a4-4435-887e-23dd60f8b8dd
画面を少し下にずらしていくと、モデル UUID の記載があり、これをさっきのデモページに入力すると、デモで試せる音声モデルを変えられました。