この記事を読むとできるようになること
- NVIDIA Driver のインストール
- CUDA のインストール
環境
Ubuntu 22.04 LTS (jammy)
NVIDIA GeForce RTX 3090 24GB
おおまかな手順
-
nvidia-driver-***のインストール - CUDA (
nvidia-cuda-toolkit) のインストール
//! nvidia-container-toolkit
nvidia-deriver-*** のインストール
参考のサイト:ubuntuにCUDA、nvidiaドライバをインストールするメモ
すでにインストールされているドライバの確認
dpkg -l | grep nvidia
すでにインストールさている場合はドライバの削除
sudo apt --purge remove nvidia-*
Ubuntu 22.04 直後で既にインストールされている場合とかだったら、もしかしたら削除しなくてもできるかもしれない?(製作論3で Ubuntu22.04 を USB ブートして NVIDIA ドライバをインストールした TA の経験より)
インストールするドライバを確認
ubuntu-drivers devices
# 出力
vendor : NVIDIA Corporation
model : GA102 [GeForce RTX 3090]
driver : nvidia-driver-535-server - distro non-free
driver : nvidia-driver-535-open - distro non-free
driver : nvidia-driver-545-open - distro non-free
driver : nvidia-driver-535 - distro non-free recommended
driver : nvidia-driver-470 - distro non-free
driver : nvidia-driver-535-server-open - distro non-free
driver : nvidia-driver-545 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
nvidia-driver のインストール
recommended がついてるものをインストール
sudo apt install nvidia-driver-535
再起動
sudo reboot
インストールされたことの確認
nvidia-smi
CUDA のインストール
参考のサイト:ubuntuにCUDA、nvidiaドライバをインストールするメモ
すでにインストールされている CUDA の確認
dpkg -l | grep cuda
すでにインストールさている場合は CUDA の削除
sudo apt --purge remove cuda-*
CUDA Toolkit Archive から、目的のバージョンの CUDA Toolkit をインストールできるコマンドを生成
(今回の場合はこれ)
Operationg System : Linux
Architecture : x86_64
Distribution : Ubuntu
Version : 22.04
Installer Type : deb (local)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
実行中に発生したエラー
状況
nvidia-driver-525 をインストールした後、sudo apt install cuda をしたとき
ERROR: Cannot create report: [Errno 17] File exists: '/var/crash/nvidia-dkms-520.0.crash'
Error! Bad return status for module build on kernel: 6.5.0-28-generic (x86_64)
Consult /var/lib/dkms/nvidia/520.61.05/build/make.log for more information.
メモ
-
cuda 11.8 に対応するのはもしかして nvidia-driver-520 なのかも?
-
sudo apt -y install cudaした後、sudo apt --purge remove cudaすると最後にnvidia-driver-520がどうのこうのって出てくる- あえて
sudo apt -y install nvidia-driver-520とすると、nvidia-driver-535がインストールされる
- あえて
-
-
nvidia-driver-525 に対応するのが cuda 12.0 なのかも?-
nvidia-driver-525 をインストールした後の nvidia-smi を実行すると CUDA Version : 12.2 が表示される-
nvidia-driver-525に入れることができる最大の CUDA のバージョンが12.2って意味らしい(参考)
-
-
CUDA 11 and Later Defaults to Minor Version Compatibility によると CUDA 11.x は nvidia-driver-540.80.02* 以上をインストールしていれば大丈夫っぽいが...?
-
CUDAをインストールすると勝手にnvidia-driver-***がインストールされるらしい
535 + 12.2
手順
-
nvidia-driver-535のインストール -
nvidia-smiでCUDA Versionの確認 - 確認した
CUDAのバージョンをインストール
sudo apt install nvidia-driver-535
sudo reboot
nvidia-smi
CUDA 12.2 のインストール
これは何も問題なく完了できた!
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-12-2
ただこれだと RVC-WebUI がバージョンの違いで起動しない
やっぱり CUDA 11.8 が必要
535 + 11.8
最初に試して無理だったやつ
11.8
これでできた...なんでぇ...?
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-11-8
できたことを確認
nvidia-smi
解決したいとぐち
535 に対応する CUDA を調べる -> 11.8 は対応しているはずであることが確認される -> 535 をインストールしてから 11.8 だとエラーになる -> ならば逆に 11.8 をインストールしてから 535 をインストール(つまり 11.8 のインストールに必要な nvidia-driver のバージョンを apt に判断させる)すればよいのでは? -> 試しに 11.8 のインストール手順でインストールしてみる -> できた!