はじめに
日本語の音声読み上げアプリをローカルで動かしたくて、
Pythonで作ってみました。
最初は簡単にできると思ってたんですが、
かなりハマりました…。
---## ハマったところ(ここが本題)
① libcudart エラー
最初にこれで止まりました。
OSError: libcudart.so.13: cannot open shared object file
原因:
→ GPU版のPyTorchが入っていた
対応:
pip uninstall torch torchaudio -y
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cpu
② PyTorchのバージョン問題
最新のPyTorchだと、こんなエラーが出ました。
WeightsUnpickler error: unsupported global
原因:
→ PyTorch 2.6以降の仕様変更
対応:
pip install torch==2.3.0+cpu torchaudio==2.3.0+cpu \
--index-url https://download.pytorch.org/whl/cpu
③ TTS[ja] がインストールできない
ERROR: No matching distribution found for TTS[ja]
原因:
→ Python 3.12を使っていた
対応:
→ Python 3.10で環境を作り直し
python3.10 -m venv venv
④ 日本語phonemizer問題
日本語読み上げには追加パッケージが必要でした。
pip install "TTS[ja]"
さらに必要に応じて👇
sudo apt install mecab libmecab-dev mecab-ipadic-utf8
学んだこと
音声系は依存関係が多くて意外と大変
PyTorchのバージョンはかなり重要
Pythonのバージョンも地味にハマる
まとめ
最初は「すぐできるかな」と思ってましたが、
エラーだらけでかなり時間かかりました。
でも最終的にちゃんと動いて、
配布までできたので満足しています。
おわりに
もし同じようにハマっている人がいたら、
少しでも参考になれば嬉しいです。
## 完成したもの
テキストを入力すると、日本語音声で読み上げるアプリです。
ダウンロードはこちら👇
https://km.kokage.cc/
---