こんにちは!
この記事では、大人気の音声合成ソフト「VOICEVOX」を、自分のパソコンで動かすための手順を、どこよりも分かりやすく解説します。プログラミングの経験がない方でも大丈夫!ステップバイステップで進めていけば、好きなキャラクターに好きな言葉をしゃべらせることができるようになりますよ。
[!NOTE] 動作確認環境
この記事は以下の環境で動作確認を行っています:
- OS: Windows 11 Pro
- CPU: Intel Core i7 (x64)
- Python: 3.13.3
- VOICEVOX Core: 0.16.0
他の環境でも基本的な手順は同じですが、細かい部分で違いがある場合があります。
VOICEVOXって?
VOICEVOXは、テキスト(文字)を入力するだけで、キャラクターの音声で読み上げてくれるフリーの音声合成ソフトです。たくさんの個性的なキャラクターがいて、動画制作やゲーム実況など、さまざまな場面で活躍しています。
開発者について
VOICEVOXは、Hiroshibaさんを中心とした開発チームによって開発されています。オープンソースプロジェクトとして、多くの貢献者によって継続的に改良されている素晴らしいソフトウェアです。
通常は専用のアプリケーションを使いますが、この記事ではその「心臓部」であるVOICEVOX Core
を直接動かして、もっと手軽に音声合成を体験する方法をご紹介します。
ステップ1:必要なファイルをダウンロードしよう
まずは、VOICEVOXを動かすために必要なファイルをダウンロードします。
-
VOICEVOX CoreのGitHubにアクセスします。
-
ページ上部の「ダウンローダ」という表から、お使いのPCに合ったファイルをクリックしてダウンロードします。
OS アーキテクチャ ファイル名 Windows x64 download-windows-x64.exe macOS x64 download-osx-x64 macOS arm64 download-osx-arm64 Linux x64 download-linux-x64 Linux arm64 download-linux-arm64 -
Windowsをお使いの方は、
download-windows-x64.exe
をクリックしてください -
macOS(Intel Mac) をお使いの方は、
download-osx-x64
をクリックしてください -
macOS(Apple Silicon Mac) をお使いの方は、
download-osx-arm64
をクリックしてください
-
Windowsをお使いの方は、
-
ダウンロードしたファイルは、分かりやすいように名前を
download.exe
(Windowsの場合)に変更しておきましょう。
ステップ2:VOICEVOXの本体を準備しよう
次に、先ほどダウンロードしたファイルを使って、VOICEVOXの本体(音声モデルやライブラリなど)をインターネットから自動でダウンロードします。
-
作業用フォルダを作成します
まず、VOICEVOXの作業用フォルダを作成しましょう。デスクトップに「VOICEVOX」という名前のフォルダを作成し、そこにダウンロードしたdownload.exe
を移動します。 -
コマンドプロンプトを起動します。
- Windowsの検索バーに「cmd」と入力すると見つかります。
-
コマンドプロンプトで、作成したVOICEVOXフォルダに移動します。以下のコマンドを入力してEnterキーを押します。
cd Desktop\VOICEVOX
-
以下のコマンドを入力して実行すると、ダウンロードが始まります。少し時間がかかるかもしれませんが、気長に待ちましょう。
./download.exe --exclude c-api
-
ダウンロードが終わると、同じフォルダに
voicevox_core
という新しいフォルダが作られているはずです。これで準備は完了です!
ステップ3:PythonでVOICEVOXを動かしてみよう!
いよいよ、簡単なプログラム(Python)を使って、実際に音声を作ってみます。
[!NOTE] Pythonの準備
この手順では、プログラミング言語の「Python」を使います。もしPCにPythonがインストールされていない場合は、Python公式サイトなどから事前にインストールしておいてください。
-
VOICEVOXライブラリのインストール
コマンドプロンプトで、以下のコマンドを実行して、VOICEVOXをPythonで動かすためのライブラリをインストールします。まず、VOICEVOX Coreの最新リリースページにアクセスし、「Python wheel」の項目からお使いの環境に合ったファイルを探します。
Windowsの場合は、以下の2つのファイルから選択します:
-
voicevox_core-[バージョン]+cpu-cp310-abi3-win32.whl
:32bit版Windows用 -
voicevox_core-[バージョン]+cpu-cp310-abi3-win_amd64.whl
:64bit版Windows用
ほとんどの場合は64bit版(
win_amd64
)を選択してください。選択したファイル名を右クリックして「リンクのアドレスをコピー」し、以下のコマンドを実行します:pip install [コピーしたURL]
例(バージョン0.16.0の場合):
pip install https://github.com/VOICEVOX/voicevox_core/releases/download/0.16.0/voicevox_core-0.16.0+cpu-cp310-abi3-win_amd64.whl
[!NOTE]
GPU版を使いたい場合は、ファイル名の+cpu
の部分が+cuda
や+directml
になっているファイルを選択してください。32bit版Windowsの場合はwin_amd64
ではなくwin32
のファイルを選択してください。 -
-
サンプルコードで音声を作成
以下のコードをコピーして、メモ帳などのテキストエディタに貼り付け、voicevox_core
フォルダの中にtest.py
という名前で保存してください。import os import voicevox_core # --- 設定 --- # 話者ID(キャラクターの声)を指定します # どのキャラクターがどのIDかは、公式サイトで確認できます SPEAKER_ID = 3 # ずんだもん(ノーマル) # 読み上げるテキスト TEXT_TO_SPEAK = "こんにちは、ボイスボックスの音声合成を試しています。" # 音声ファイルの保存先 OUTPUT_WAV_PATH = "output.wav" # --- 設定はここまで --- def main(): # voicevox_coreフォルダのパスを取得 core_dir = os.path.dirname(os.path.abspath(__file__)) # 必要なファイルを絶対パスで指定 open_jtalk_dict_dir = os.path.join(core_dir, "open_jtalk_dic_utf_8-1.11") # ライブラリのバージョンに合ったonnxruntimeのパスを指定 onnxruntime_lib_path = None for file in os.listdir(os.path.join(core_dir, "onnxruntime", "lib")): if file.startswith("onnxruntime.") and file.endswith((".dll", ".so", ".dylib")): onnxruntime_lib_path = os.path.join(core_dir, "onnxruntime", "lib", file) break if onnxruntime_lib_path is None: print("ONNX Runtimeのライブラリが見つかりませんでした。") return # 音声モデル(vvmファイル)のパスを指定 # ここでは例として最初のvvmファイルを使います model_dir = os.path.join(core_dir, "model") model_path = None for file in os.listdir(model_dir): if file.endswith(".vvm"): model_path = os.path.join(model_dir, file) break if model_path is None: print("音声モデル(.vvmファイル)が見つかりませんでした。") return # 音声合成の準備 synthesizer = voicevox_core.Synthesizer( voicevox_core.Onnxruntime.load_once(onnxruntime_lib_path), voicevox_core.OpenJtalk(open_jtalk_dict_dir), ) # 音声モデルを読み込む model = voicevox_core.VoiceModel.from_path(model_path) synthesizer.load_voice_model(model) # 音声合成を実行 wav = synthesizer.tts(TEXT_TO_SPEAK, SPEAKER_ID) # 音声ファイルとして保存 with open(OUTPUT_WAV_PATH, "wb") as f: f.write(wav) print(f"音声ファイル '{OUTPUT_WAV_PATH}' を作成しました!") print(f"キャラクター: {SPEAKER_ID}") print(f"テキスト: {TEXT_TO_SPEAK}") if __name__ == "__main__": main()
-
プログラムの実行
コマンドプロンプトで、voicevox_core
フォルダに移動し、以下のコマンドを実行します。# voicevox_coreフォルダに移動(Desktop\VOICEVOXの中にある) cd Desktop\VOICEVOX\voicevox_core # プログラムを実行 python test.py
-
音声ファイルの確認
実行後、voicevox_core
フォルダの中にoutput.wav
という音声ファイルが作られていれば成功です!再生して、キャラクターの声でテキストが読み上げられるか確認してみてください。
もっと楽しむには?
-
キャラクターを変えたい!
サンプルコードのSPEAKER_ID = 3
の数字を変えることで、他のキャラクターにしゃべらせることができます。どのキャラクターがどの番号かは、公式サイトの対応表で確認できます。 -
セリフを変えたい!
TEXT_TO_SPEAK = "..."
の部分を、好きな言葉に書き換えてみましょう。
おわりに
このガイドを通じて、VOICEVOX Coreを使った音声合成の基本的な手順をご紹介しました。VOICEVOX Coreは高品質な音声合成を手軽に利用できる優れたツールです。
今回のサンプルコードは基本的な使い方の一例に過ぎません。VOICEVOX Coreには他にも多くの機能があり、音声の速度や高さの調整、ユーザー辞書の活用など、さらに高度な音声合成も可能です。
注意事項
- 生成された音声を商用利用する場合は、各音声モデルの利用規約を必ずご確認ください
- このツールを使用する際は、他者の権利を尊重し、適切な用途でご利用ください
さらに学習したい方へ
VOICEVOX Coreを活用して、創造的なプロジェクトにお役立ていただければ幸いです。