Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

[備忘録] Ubuntu22.04 で CUDA 11.8 を使えるようになるまで

0
Last updated at Posted at 2024-05-13

この記事を読むとできるようになること

  • NVIDIA Driver のインストール
  • CUDA のインストール

環境

Ubuntu 22.04 LTS (jammy)
NVIDIA GeForce RTX 3090 24GB

おおまかな手順

  1. nvidia-driver-*** のインストール
  2. CUDA (nvidia-cuda-toolkit) のインストール

//! nvidia-container-toolkit

nvidia-deriver-*** のインストール

参考のサイト:ubuntuにCUDA、nvidiaドライバをインストールするメモ

すでにインストールされているドライバの確認

dpkg -l | grep nvidia

すでにインストールさている場合はドライバの削除

sudo apt --purge remove nvidia-*

Ubuntu 22.04 直後で既にインストールされている場合とかだったら、もしかしたら削除しなくてもできるかもしれない?(製作論3で Ubuntu22.04 を USB ブートして NVIDIA ドライバをインストールした TA の経験より)

インストールするドライバを確認

ubuntu-drivers devices
# 出力
vendor   : NVIDIA Corporation
model    : GA102 [GeForce RTX 3090]
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-535-open - distro non-free
driver   : nvidia-driver-545-open - distro non-free
driver   : nvidia-driver-535 - distro non-free recommended
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-535-server-open - distro non-free
driver   : nvidia-driver-545 - distro non-free
driver   : nvidia-driver-470-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

nvidia-driver のインストール

recommended がついてるものをインストール

sudo apt install nvidia-driver-535

再起動

sudo reboot

インストールされたことの確認

nvidia-smi

CUDA のインストール

参考のサイト:ubuntuにCUDA、nvidiaドライバをインストールするメモ

すでにインストールされている CUDA の確認

dpkg -l | grep cuda

すでにインストールさている場合は CUDA の削除

sudo apt --purge remove cuda-*

CUDA Toolkit Archive から、目的のバージョンの CUDA Toolkit をインストールできるコマンドを生成

(今回の場合はこれ

Operationg System : Linux
Architecture : x86_64
Distribution : Ubuntu
Version : 22.04
Installer Type : deb (local)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda

実行中に発生したエラー

状況

nvidia-driver-525 をインストールした後、sudo apt install cuda をしたとき

ERROR: Cannot create report: [Errno 17] File exists: '/var/crash/nvidia-dkms-520.0.crash'
Error! Bad return status for module build on kernel: 6.5.0-28-generic (x86_64)
Consult /var/lib/dkms/nvidia/520.61.05/build/make.log for more information.

メモ

  • cuda 11.8 に対応するのはもしかして nvidia-driver-520 なのかも?

    • sudo apt -y install cuda した後、sudo apt --purge remove cuda すると最後に nvidia-driver-520 がどうのこうのって出てくる
      • あえて sudo apt -y install nvidia-driver-520 とすると、nvidia-driver-535 がインストールされる
  • nvidia-driver-525 に対応するのが cuda 12.0 なのかも?

    • nvidia-driver-525 をインストールした後の nvidia-smi を実行すると CUDA Version : 12.2 が表示される
      • nvidia-driver-525 に入れることができる最大の CUDA のバージョンが 12.2 って意味らしい(参考

CUDA 11 and Later Defaults to Minor Version Compatibility によると CUDA 11.xnvidia-driver-540.80.02* 以上をインストールしていれば大丈夫っぽいが...?

  • CUDA をインストールすると勝手に nvidia-driver-*** がインストールされるらしい

535 + 12.2

手順

  1. nvidia-driver-535 のインストール
  2. nvidia-smiCUDA Version の確認
  3. 確認した CUDA のバージョンをインストール
sudo apt install nvidia-driver-535
sudo reboot
nvidia-smi

CUDA 12.2 のインストール

これは何も問題なく完了できた!

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-12-2

ただこれだと RVC-WebUI がバージョンの違いで起動しない

やっぱり CUDA 11.8 が必要

535 + 11.8

最初に試して無理だったやつ

11.8

これでできた...なんでぇ...?

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-8-local_11.8.0-520.61.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-11-8

できたことを確認

nvidia-smi

解決したいとぐち

535 に対応する CUDA を調べる -> 11.8 は対応しているはずであることが確認される -> 535 をインストールしてから 11.8 だとエラーになる -> ならば逆に 11.8 をインストールしてから 535 をインストール(つまり 11.8 のインストールに必要な nvidia-driver のバージョンを apt に判断させる)すればよいのでは? -> 試しに 11.8 のインストール手順でインストールしてみる -> できた!

0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?