AWSのGPUインスタンス(Ubuntu 16.04)で
FATAL: Module nvidia-uvm not found in directory
というエラーが出たのでその対処法
CUDAをインストールしたら解決した
- まず既存のドライバを無効に
$ echo -e "blacklist nouveau\nblacklist lbm-nouveau\noptions nouveau modeset=0\nalias nouveau off\nalias lbm-nouveau off\n" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
$ sudo update-initramfs -u
$ sudo reboot
- カーネルモジュールをインストール
$ sudo apt-get install -y linux-image-extra-virtual
$ sudo reboot
$ sudo apt-get install -y linux-source linux-headers-`uname -r`
- CUDAをインストール
- https://developer.nvidia.com/cuda-downloads
- ここで登録を行ってから
- 自分の環境にあったものを選んでいく
-
$ cat /etc/lsb-release
でUbuntuのバージョンとか確認できる
-
$ https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1604-10-1-local-10.1.168-418.67_1.0-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu1604-10-1-local-10.1.168-418.67_1.0-1_amd64.deb
$ sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get install cuda
$ rm cuda-repo-ubuntu1804_10.1.168-1_amd64.deb
- この後 ~/.bashrc の末尾に以下を追記
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
- その後再ログインして
nvidia-smi
で動作確認できる
$ sudo reboot
$ nvidia-smi