nvidia-smi 攻略チートシート
そろそろnvidia-smiにキレ始めているので, チートシートを書いておきます.
環境
OS : ubuntu 20.04
Architecture : x86_64
手順
- 全てのnvidia driver, cudaを削除する
- nvidia driverとcudaのバージョンの対応を確認
- nvidia driverをインストール
- cudaをインストール
説明
手順1 : 全てのnvidia driver, cudaを削除する
まず, nvidia driver, cudaがインストールされているか確認する.
dpkg -l | grep nvidia
dpkg -l | grep cuda
続いて, 全てを消し去る
sudo apt-get purge remove cuda*
sudo apt-get purge remove nvidia*
ここで油断してはいけない. おそらく何個かは消えていない. そのためもう一度上記のコードにて確認する.
残っていたものを一掃する(removeの後ろは残っているファイルに合わせて変えてね).
sudo apt-get purge remove libnvidia* #libnvidia-のファイルが消えていなかった為指定する
そしてもう一度確認し、完全に消し去る.
※ ファイル名の前にlinux-とつくファイルは消さないらしい(知らんけど)
手順2 : nvidia driverとcudaのバージョンの対応を確認
まず自身のマシンが推奨するnvidia driverのバージョンを確認する.
ubuntu-drivers devices
ここで表示されたドライバのどれをインストールするか決める.
続いて, ドライバとCUDAの対応表(Table3を参照しよう)から, 推奨されたドライバに対応するCUDAを確認する.
手順3 : nvidia driverをインストール
キミに決めたドライバをインストール.
sudo apt install -y --no-install-recommends nvidia-driver-510 #今回は510
これでnvidia driverのインストールが完了する.
お決まりの再起動をしましょう.
sudo reboot
ドキドキのnvidia-smi.
nvidia-smi
できてたら神, できてなかったら一週間ほど熟成させましょう. そして新たな策を模索しましょう.
手順4 :
手順2でのドライバとCUDAの対応表にて, インストールしたドライバに対応するCUDAをインストールする.
今回はCUDA11.6 Update2 をこちらからインストールする.
自身のマシンの状態を打ち込み, 表示されたコードを順番に打ち込む.
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-6-local_11.6.2-510.47.03-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-6-local/7fa2af80.pub
sudo apt-get update
そして最後の一行を打つが, ここで注意!
sudo apt-get -y install cuda # CUDAのバージョンを指定しないとダメよ
このままだと, 最新バージョンのCUDAがインストールされてしまう.
なので
sudo apt-get -y install cuda-11.6
このようにバージョンを指定してインストールを行う.
まとめ
いい加減何回もnvidia-smiがおかしくなったりするのだから, もっっっっっと楽に使えるような仕様になってほしい.