Rustでずんだもんが代理でしゃべるSIP電話を作る Advent Calendar 2025

RustでSIP音声ボット（ずんだもん）を作るメモ：音声合成

Last updated at 2025-12-14Posted at 2025-12-14

この記事は筆者オンリーのAdvent Calendar 202513日目の記事です。

RustでSIP通話を受けて、ASR→LLM→音声合成→相手に返す、という音声ボットを作っています。
この記事は 音声合成（TTS） パートの話だけを、ざっくり紹介します。

結論：ずんだもんを使うならVOICEVOX一択

今回のボットは ずんだもん に喋らせたいので、音声合成は実質 VOICEVOX一択 でした。

「ずんだもんで喋らせる」を最優先にすると、選定で悩む余地がほぼなくなります。

VOICEVOXは大きく「エンジン（音声合成サーバ）」を立てて、HTTPで合成します。

使い方の流れは基本これだけ：

つまり、テキストを投げて終わりというより
「クエリ生成 → 合成」の2段階になってる、くらいの理解でOKです。