はじめに
株式会社エーアイさんの AITalk WebAPI を少し試してみた、という内容の記事です。
上記の API を、ヒーローズ・リーグ2025 というコンテストの関連で期間限定でお借りして使える状態になったので、まずはその API を軽く試してみました。
●ヒーローズ・リーグ 2025
https://heroes-league.net/#league
●株式会社エーアイ | ProtoPedia
https://protopedia.net/company/ai-j
さっそく試してみる
早速、AITalk WebAPI(自分の場合はコンテスト用のデモプラン)を試していきます。
接続ID・接続パスワードの情報を確認
以下にログインして、「接続ID」「接続パスワード」の 2つの情報を確認します。
●ご法人様 管理画面
https://cloud.ai-j.jp/manage/user/login.php
API の公式ドキュメントを確認
次に、以下の公式ドキュメントで仕様を確認してみます。
●AITalk®5 WebAPI ユーザーマニュアル — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/
音声合成の API の説明
とりあえず、シンプルの音声合成を試せる方法を見てみました。
●音声合成 (ttsget) — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/modules/Api/TTSGet.html
上記のページの「リクエスト例」という部分を見てみます。
例えば、Linux(bash)という部分には、以下が書かれていました。
curl -s -v -XPOST \
-d "username=【ユーザー名】&password=【パスワード】&speaker_name=nozomi&text==%E4%BB%8A%E6%97%A5%E3%81%AF%E3%81%84%E3%81%84%E5%A4%A9%E6%B0%97%E3%81%A7%E3%81%99%E3%81%AD%E3%80%82" \
https://webapi.aitalk.jp/webapi/v5/ttsget.php
音声合成の API を試す
上記を元に、自分の環境(今回は Mac)で試してみます。
curlコマンドを使って、以下の内容で試しました。
curl -s\
--data-urlencode "username=【ユーザー名】" \
--data-urlencode "password=【パスワード】" \
--data-urlencode "speaker_name=nozomi" \
--data-urlencode "text=こんにちは。今日はいい天気ですね。" \
https://webapi.aitalk.jp/webapi/v5/ttsget.php \
-o nozomi01.wav
上記を実行することで、上記を実行したフォルダ直下に「nozomi01.wav」というファイルが生成されました。それを再生してみたところ、上記で指定した「こんにちは。今日はいい天気ですね。」という内容が読み上げられたものになっていました。
その他
話者について
以下の公式ドキュメントを見ると、様々な話者を指定できるようです。
●話者一覧 — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/modules/Speakers.html#speakers
日本語話者・英語話者
以下に、日本語話者・英語話者の部分を掲載してみます。
出力データ形式について
出力データ形式について、以下の部分を見てみます。
●API 概要 — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/modules/Api/About.html#api-about-protocol
以下の「出力データ形式」に書かれた形式で、データを得ることができるようです。
リクエストパラメーターについて
以下の部分から、リクエストパラメーターを見てみます。
●音声合成 (ttsget) — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/modules/Api/TTSGet.html#api-tts-get-post-request-parameter
以下のパラメーターを指定できるようです。
「スタイル」のパラメーター
個人的には、以下の「スタイル」のパラメーターが気になりました。
●音声合成 (ttsget) — AITalk 5 WebAPI ユーザーマニュアル v5.1.0 ドキュメント
https://www.ai-j.jp/manual/business/webapi/5/modules/Api/TTSGet.html#api-tts-get-post-request-parameter-style







