0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Pytorchから逆算したNvidia-DriverとCUDAのインストール

Posted at

初めに

この記事は、普段Pytorchで深層学習を行う私の、CudaとNvidia-Driverのインストール方法のメモです。そのため、Pytorchを使用しない人はその他のサイトを参考すると良いかもしれません。

また、間違った認識・記述があれば、是非コメントお願いします。

準備

まずは、以下4つを調査する。

  1. LinuxのKernel等のバージョンを確認
  2. PytorchのサイトでPytorchが対応しているCUDAのversionを確認
  3. 対象CUDAのためのNvidia-Driverのversionを確認
  4. Nvidiaサイトでサポートしている対象CUDAのUbuntu環境を確認

1. Linuxのkernelのバージョンを調査

私が使用した環境は、以下の表で示す。

Distribution Kernel GPU
Ubuntu 20.04.6 LTS 5.4.0-182-generic GeForce RTX 4090
Distribution, Kernel 確認コマンド
Distribution 確認コマンド
cat /etc/lsb-release

##出力結果
5.4.0-182-generic
Kernel 確認コマンド
uname -r

##出力結果
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=20.04
DISTRIB_CODENAME=focal
DISTRIB_DESCRIPTION="Ubuntu 20.04.6 LTS"

2.PytorchのサイトでPytorchが対応しているCUDAのversionを確認

  • Pytorhcのinstallサイト
    2024/5月現在、pipでのPytorchのinstallでは、CUDA 12.1まで対応している。(やっぱり最新を使いたい)
    スクリーンショット 2024-05-22 7.48.16.png

3. 対象CUDAのためのNvidia-Driverのversionを確認

4. Nvidiaサイトでサポートしている対象CUDAのUbuntu環境を確認

  • System Requirements
    2024/5月現在で、CUDA 12.1でサポートされているLinux Kernelは、5.15.0-43。
    スクリーンショット 2024-05-22 8.16.42.png

    筆者はKernelを合わせるためにいろいろ試してみたが、結局上手くいかなかった。Kerelが一致していなくても動いたため、現状無視している。

Nvidia-Driverをinstall

  • 最初に

    DriverやCUDAが入っている場合は削除する
    DriverとCUDAを削除
    sudo apt-get --purge remove nvidia-*
    sudo apt-get --purge remove cuda-*
    
  • Nvidia-Driverのinstallは、NVIDIAのサイトが提示したコマンドを少し変えて実行したらOK

    • Installer Typeは、deb (network)にしています。環境に応じて、選択するタイプは変更して下さい。

    スクリーンショット 2024-05-23 10.18.27.png

  • 提示されたコマンドは、以下のように変更します。(今回は535にしていますが、525以上であればOK)

    Driverのinstallコマンド
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
    sudo apt-get update
    sudo apt-get -y install cuda-drivers-535
    

CUDAをinstall

  • 実行コマンド

    CUDAのinstallコマンド
    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
    sudo apt-get update
    sudo apt-get -y install cuda
    (もしくは、sudo apt-get -y install cuda-toolkit-12-5)
    

CUDAとNvidia-Driverのバージョンを確認

  • CUDAのバージョンを確認する際は、以下のコマンド
    CUDA version 確認コマンド
    /usr/local/cuda/bin/nvcc --version
    
  • Nvidia-Driverのバージョン確認は、以下のコマンド
    Nvidia-Driver version 確認コマンド
    cat /proc/driver/nvidia/version
    

その他

ちなみに、Nvidia-Dockerはこちらの記事が非常に参考になる。

最後に

  • Pytorchから逆算したNvidia-DriverとCUDAのインストール法を紹介したが、Pytorchのバージョン依存を気にしなくても、おそらく関係ないかもしれない。
  • また、NVIDIAがサポートしているKernelも変更したいが、Kernelを変更しようとするとPCがブラックアウトした。全Kernelでサポートしてくれないのだろうか。ちょっと不満。
0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?