最近、様々なYoutuberが有名人の声で学習したモデルを使って音声を復元したりしていることを見て僕もやってみたく挑戦してみました!まず、DDSP-SVCをインストールして学習をさせる準備をしましょう!
1. Repository ダウンロード
まず、下のコマンドでRepositoryをダウンロードしましょう!GPUが装着されているPCでやってください。
$ git clone https://github.com/yxlllc/DDSP-SVC.git
2. Cuda インストール
Cudaが必要です。自分のGPUバージョンにあうCudaをインストールしてください。下のリンク参照してください。
https://imagingsolution.net/program/cuda/cuda-download-install/
$ nvcc-V
上のコマンドを入れて下の図のように出るとインストール完了です。
3. Anaconda インストール
仮想環境の使用のためAnacondaもインストールしましょう!
https://www.anaconda.com/download
インストールが終わったら下のコマンドで仮想環境を作りましょう!
$ conda create --name ddsp python=3.8
それでは仮想環境に入ります!下のコマンド入れてください。
$ conda activate ddsp
4. Pytorch インストール
下のコマンドを入れてPytorchをインストールします!
$ pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu114
5. 必要なパッケージインストール
必要なパッケージをインストールします。
$ cd DDSP-SVC
$ pip install -r requirements.txt
6. Pre_trainedモデルダウンロード
https://oo.pe/https://ibm.ent.box.com/s/z1wgl1stco8ffooyatzdwsqn2psd9lrr
上のリンクからモデルをダウンロードして\DDSP-SVC\pretrain\hubertの中に入れてください。
https://oo.pe/https://github.com/openvpi/vocoders/releases/download/nsf-hifigan-v1/nsf_hifigan_20221211.zip
このリンクからもモデルをダウンロードして\DDSP-SVC\pretrain\nsf_hifiganの中に展開してください。
以上で学習の準備は終わりました。次は学習データ収集についてです。