1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

nvidia-smi 攻略チートシート

Posted at

nvidia-smi 攻略チートシート

そろそろnvidia-smiにキレ始めているので, チートシートを書いておきます.

環境

OS : ubuntu 20.04
Architecture : x86_64

手順

  1. 全てのnvidia driver, cudaを削除する
  2. nvidia driverとcudaのバージョンの対応を確認
  3. nvidia driverをインストール
  4. cudaをインストール

説明

手順1 : 全てのnvidia driver, cudaを削除する

まず, nvidia driver, cudaがインストールされているか確認する.

dpkg -l | grep nvidia  
dpkg -l | grep cuda 

続いて, 全てを消し去る

sudo apt-get purge remove cuda*
sudo apt-get purge remove nvidia*

ここで油断してはいけない. おそらく何個かは消えていない. そのためもう一度上記のコードにて確認する.
残っていたものを一掃する(removeの後ろは残っているファイルに合わせて変えてね).

sudo apt-get purge remove libnvidia*  #libnvidia-のファイルが消えていなかった為指定する

そしてもう一度確認し、完全に消し去る.
※ ファイル名の前にlinux-とつくファイルは消さないらしい(知らんけど)

手順2 : nvidia driverとcudaのバージョンの対応を確認

まず自身のマシンが推奨するnvidia driverのバージョンを確認する.

ubuntu-drivers devices

ここで表示されたドライバのどれをインストールするか決める.

続いて, ドライバとCUDAの対応表(Table3を参照しよう)から, 推奨されたドライバに対応するCUDAを確認する.

手順3 : nvidia driverをインストール

キミに決めたドライバをインストール.

sudo apt install -y --no-install-recommends nvidia-driver-510  #今回は510

これでnvidia driverのインストールが完了する.
お決まりの再起動をしましょう.

sudo reboot

ドキドキのnvidia-smi.

nvidia-smi

できてたら神, できてなかったら一週間ほど熟成させましょう. そして新たな策を模索しましょう.

手順4 :

手順2でのドライバとCUDAの対応表にて, インストールしたドライバに対応するCUDAをインストールする.

今回はCUDA11.6 Update2 をこちらからインストールする.

自身のマシンの状態を打ち込み, 表示されたコードを順番に打ち込む.

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub
sudo apt-get update

そして最後の一行を打つが, ここで注意!

sudo apt-get -y install cuda  # CUDAのバージョンを指定しないとダメよ

このままだと, 最新バージョンのCUDAがインストールされてしまう.
なので

sudo apt-get -y install cuda-11.6

このようにバージョンを指定してインストールを行う.

まとめ

いい加減何回もnvidia-smiがおかしくなったりするのだから, もっっっっっと楽に使えるような仕様になってほしい.

1
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?