はじめに
MOE-TTSという文章読み上げAIが公開されました。
ウェブ上で使えるものですが、ローカルでの実行も出来たので、インストール~起動までの手順を記録しておきます。
起動までの手順
必要スペック
特に指定はないが、NVidia製のグラボがあると高速化可能
必要ソフト
- CUDA toolkit 11.7(最新は11.8だが、pytorchが対応していない)
- Anaconda
- git
手順
ソースコードの入手
git lfs install
git clone https://huggingface.co/spaces/skytnt/moe-tts
conda環境の設定
conda create -n moe python=3.10
conda activate moe
python関連のインストール
pytorchのインストールコマンドを入手します。
PyTorch←こちらから自分の環境を選択し、Conda用のインストールコマンドを作成する
コマンド例
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
依存モジュールのインストール
取得したソースコードのうち、requirements.txtから以下の3行を削除する
torch
torchvision
torchaudio
以下のコマンドを実行
pip install -r requirements.yxy
初回実行
ソースコードのディレクトリに移動し、以下のコマンドを実行
pip install -r requirements.txt
初回は関連ファイルのダウンロードが発生するため、時間がかかる。
以下のような表示が出たら完了。表示されたURLにアクセスしましょう。
Using cache found in C:\Users\super/.cache\torch\hub\bshall_hubert_main
Running on local URL: http://127.0.0.1:7860
To create a public link, set `share=True` in `launch()`.
二回目以降の起動
二回目以降は以下の手順のみ
conda activate moe
python app.py --device=cuda
うまくいかない場合
cuda関連で失敗する場合は、CPUでの動作も可能。上記手順からの変更点は
- pytorchの個別インストールを行わない
- requirements.txtからtorch関連を取り除かない
- 実行時、--device=cudaを付けない