はじめに
音声合成のVibeVoice-Realtime-0.5Bをやっていきます
開発環境
- MacBook Air M1, 2020
- Python 3.12
導入
Colabはここにあります
実行結果はこちら
VibeVoice-Realtime-0.5B pic.twitter.com/hZo95CcP9Z
— がちもとさん (@sotongshi) December 5, 2025
こちらのサンプルコードが参考になります
https://github.com/microsoft/VibeVoice/blob/main/demo/vibevoice_realtime_demo.py
クローンして、実行してみましょう
git clone https://github.com/microsoft/VibeVoice.git
cd VibeVoice
pip install -e .
python demo/vibevoice_realtime_demo.py --model_path microsoft/VibeVoice-Realtime-0.5B --device mps
http://0.0.0.0:3000/ にアクセス
konnichiwa watashi no namae wa gachimoto desu.を入力してStart
4秒くらいで生成できました。生成中は音が途切れます。
MacBook Air, M1, 2020でVibeVoice-Realtime TTS、生成中はポツポツ途切れる.. pic.twitter.com/DhBhdNg1H9
— がちもとさん (@sotongshi) December 8, 2025
ダウンロードしたwavは問題なさそうです。
MacBook Air, M1, 2020でVibeVoice-Realtime TTS
— がちもとさん (@sotongshi) December 8, 2025
ダウンロードしたwavを再生するとこんな感じ pic.twitter.com/VYDyKBKdEm
お疲れ様でした。