何番煎じか分かりませんが
VOICEVOXをPythonから使います。話す速度や前後の無音部分の長さの調整、ピッチ調整などGUIでの設定をPython中でもできるというだけです。
コード
python voicevox.py
import requests
from pathlib import Path
def voicevox(text, output_path, speaker=2, speedScale=1):
url = "http://localhost:50021/audio_query"
params = {"text": text, "speaker": speaker}
timeout = 15
query_synthesis = requests.post(url, params=params, timeout=timeout)
json = query_synthesis.json()
json['speedScale'] = speedScale
json['prePhonemeLength'] = 0.3 #前に0.3秒の無音を追加
json['postPhonemeLength'] = 0.3 #後に0.3秒の無音を追加
response = requests.post(
"http://localhost:50021/synthesis",
params=params,
json=json,
)
out = Path(output_path)
out.write_bytes(response.content)
if __name__ == '__main__':
text = "音声合成のためのサンプルコードです。VOICEVOXアプリケーションまたはVOICEVOXエンジンが起動している状態で実行すると、ずんだもんのノーマルスタイルで「これはサンプルボイスです」という音声が生成されsample.wavとしてカレントディレクトリ内に保存されます。"
voicevox(text, "voicevox.wav")
"""英語から意味は察してください
'speedScale': 1.0,
'pitchScale': 0.0,
'intonationScale': 1.0,
'volumeScale': 1.0,
'prePhonemeLength': 0.1,
'postPhonemeLength': 0.1,
'pauseLength': None,
'pauseLengthScale': 1.0,
'outputSamplingRate': 24000,
'outputStereo': False,
"""