機能まで使えていた nvidia-smi が急にできなくなりました。
※ 追記2018/02/06: nvidia-smi ができなくなる理由の一つに、CUDAのアップデートがあります。CUDAの配布パッケージにはドライバが含まれるのですが、それを普通のGeforceに入れると動かなくなる事があります。なので、必ず、Nvidiaのサイトからダウンロードして、インストールしてください。また、新しいCUDAがでたからといって、それに、手持ちのGeforceが対応しているとは限りません。CUDAの対応するドライババージョンを確認してください。(参考: Ubuntu16.04を入れて、nvidia-docker2を入れて、Chainerを動かす)
※ 追記2019/02/27: 何かをapt-get upgrade しなくても、このような現象は発生します。理由は本当に分かりませんが、、私はブレーカーが落ちて、突然の電源断となった時に発生することが数回ありました。(冬はブレーカー落ちが多発してまして。。)
$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
apt-get upgrade
したかも、ということで調べたら、以下のブログが見つかりました。
参考: アップグレードしたらnvidia-smi出来なくなった話
https://blog.sky-net.pw/article/51
私は、apt-get
ではなく、Nvidiaのサイトからダウンロードしてインストールしていたので、それをやり直すことで解決しました。
1. Nouveau kernel driver がdisableになっているか確認
- /etc/modprobe.d/blacklist-nouveau.conf に以下がかかれているか確認
blacklist nouveau
options nouveau modeset=0
書かれていれば、何もしなくて良い。書かれていなければ、再設定する。
2. ドライバインストール
以前にダウンロードした、./NVIDIA-Linux-x86_64-XX.XX.run
を用意する。
無い場合、以下からダウンロード。
GTX1080 の場合は、以下のように設定して検索すれば良い。
以下のようにして、再インストール。
$ sudo service lightdm stop # x を止める
$ sudo ./NVIDIA-Linux-x86_64-375.26.run
後は画面に従う。