13
6

RVCとVCClientで始める!AIボイチェン超速入門

Last updated at Posted at 2024-07-05

ボイチェンを始めたい方向け

つい先日ボイチェンに入門したので方法をまとめます。
ボイチェンにとても詳しい方々の監修の元書きましたので、2024年7月5日現在のベストな方法だと思います。
ボイチェン通話を楽しんでいきましょう~!!

追記

この記事は、VCClient Ver1 安定版の インストール方法を解説したものです。
軽さや遅延の短さを重視する方は、アルファ版である VCllient Ver2で、Beatriceを使うのがおすすめです。

前提条件

  • NVIDIAのグラフィックボードを利用している
  • Windowsを利用している

手順

1. CUDAをインストール

CUDAは、NVIDIAのGPUを使って高速な計算をするためのソフトウェアです。

Windowsのみを利用している人

以下のリンクからCUDAをダウンロードしてインストールします。

普段WSLを利用している人

以下のリンクを参照してCUDAをインストールします。

インストールが終わったら、コマンドプロンプトを開いて以下のコマンドを入力し、インストールが成功したか確認します。

nvcc --version

2. VCClientをインストール

VCClient は、声をリアルタイムで変えるためのソフトウェアです。以下のリンクからVCClientをダウンロードします。

MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.18a.zip をダウンロードします。今回は1.5.3.18aを利用していますが、安定版ならどれでもOKです

ここで重要なことは、ダウンロード先の相対パス名(つまり、フォルダ名や親フォルダ名)にスペースや特殊文字が入っていないことです。スペースや特殊文字が入っていると正常に動作しません。
Cドライブ直下などに、RVC専用のフォルダを英数字のみの名前で作成して、VCClientを置いておくと安心です。

3. インストールしたzipファイルを解凍

ダウンロードしたzipファイルを解凍します。ファイルを右クリックして「すべて展開」を選択し、適切なフォルダに解凍します。解凍後、MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.18aというフォルダができるはずです。
Windowsでは、解凍を行わなくてもフォルダの中身が見えますが、ファイルが実行できないので、必ず、解凍を行いましょう。

4. 仮想ケーブルをダウンロードする

仮想ケーブル(Virtual Audio Cable)は、コンピュータ内で音声をやり取りするための仮想的なオーディオデバイスです。以下のリンクからダウンロードしてインストールします。

すでに類似のアプリをインストールしている場合は、改めてインストールする必要はありません。

5. VCClientを実行する

解凍したフォルダ内の MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.18a\MMVCServerSIO\start_http.bat をダブルクリックして実行します。自動的にコマンドプロンプトが開き、実行が始まります。少し待つとVCClientのウィンドウが立ち上がります。

6. ffmpegをインストールする(必要な場合)

VCClientが正常に動作しない場合、ffmpegというソフトウェアをインストールする必要があります。ffmpegは音声や動画を変換するためのツールです。

以下のリンクからffmpegをダウンロードします。

ダウンロードした後、ffmpegのbinフォルダのパスをWindowsの環境変数に追加します。以下の手順で行います

  1. デスクトップでWindowsボタンとSを同時に押し、検索窓に「環境変数」と入力します
  2. 「システム環境変数の編集」を選択します
  3. 「環境変数」をクリックします
  4. 「システム環境変数」の中の「Path」を選択して「編集」をクリックします
  5. 「新規」をクリックして、ダウンロードしたffmpegのbinフォルダのパスを貼り付けます

image.png

コマンドプロンプトを開いて以下のコマンドを入力し、パスが無事に通ったかを確認します。

ffmpeg

7. VCClientの設定を行う

MMVCServerSIO_win_onnxgpu-cuda_v.1.5.3.18a\MMVCServerSIO\start_http.batをダブルクリックしてVCClientを起動します。お好きなキャラクターを選択しましょう。右上の「開始」ボタンを押すとボイスチェンジャー機能が開始します。
出力デバイスは CABLE Input(VB-Audio Virtual Cable) に設定します。さらに「モニター」項目を自分のヘッドフォンに設定すると、ボイチェンのかかった自分の声をリアルタイムで聴くことができます。

8. 通話アプリの設定を変更する

使用している通話アプリ(例:DiscordやZoomなど)の設定を開き、入力デバイスを CABLE Output(VB-Audio Virtual Cable) に変更します。出力デバイスはそのままで問題ありません。

完成!!

これでボイチェン通話が可能になります。AI技術は日進月歩の世界ですが、この方法でしばらくは問題なく使用できると思います。お疲れさまでした!!!✨✨✨

宣伝

VCClient初回起動時にダウンロードされるプリセットモデルは汎用的なもので、より自分の声質にあったリアルでハイレベルなモデルも、GPUさえあれば個人で作成可能と聞きます。AIボイチェン沼へ足を踏み入れたい方はどうぞこちらへいらしてください。

13
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
13
6