RVC(Retrieval-based-voice-Conversion)のAIによるボイチェンが気になったので、インストールしてみましたが、いくつかはまったポイントがあったのでそのときのメモです。
インストール
最近日本語のREADMEができているので、順を追って読めば問題ないハズ。
はまったポイントその1: Microsoft Visual C++ 14以上のインストールが必要
poetry installで依存関係をインストール中に上記のインストールが必要とのメッセージ。
メッセージに従って、MSのサイトからダウンロード。
はまったポイントその2:基底モデルのインストール
基底modelsを準備の項で、Hagging Face spaceからモデルがダウンロードできると書いてあります。その下に書かれているモジュールが上記のGithubからダウンロードしてきたディレクトリの中に含まれている必要がありました。そのためFileNotFoundErrorが発生。
はまったポイントその2:CUDAがインストールされていなかった
使っているGPUはNVIDIA GeForce GTX 1660 TiでCUDA対応だったのですが、なぜかGPUが認識されていませんでした。原因はCUDAとCuDNNがインストールされていなかったこと。
これら2つをインストールした後、このままRVCを走らせてもGPUを認識しなかったので、PyTorch関連のパッケージをUninstallした後で、再インストール。ただし最新版だとだめなようで、古いバージョンのものを使用。
参考にさせて記事記事:windows,pytorchでcudaが使えない
$ pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
次のコードでGPUを認識し、CUDAが利用できるかを確認。Trueが表示されればOK。
import torch, os, traceback, sys, warnings, shutil, numpy as np
gpu = torch.cuda.is_available()
print(gpu)
さらにRVCのWeb UIを起動したときに、このようになっていればOK。