Linux初心者のため、スマートな正しい解決法だったかはわからない。
ネットで調べた以下のサイトの情報を参照に、なんとか問題は解決したので、実施内容を順番に、今後の備忘録、戒めとしてまとめておくことにした。
問題
Ubuntuのアップデートを適用後、再起動したところ、ログインループ(GUIでのログイン画面にて、パスワードを入力してログインしようとしても、一瞬画面が暗くなり、またログイン画面に戻ってしまう)にはまった。また、画面の解像度もおかしくなり、表示が非常に大きなままとなった。
問題発生時の環境設定、状況など
- Ubuntu14.04LTS
- GeForce GTX 1080Ti
- nvidia driver(バージョンは転載し忘れ)が数バージョンインストールされている状況
- cuda 8, cudnn 6.0
deeplearningの計算環境の設定に苦労したときに、様々なバージョン(の組み合わせ)を試したため、driverやcuda, cudnnが色々混在したまま残っている状況だった。解決した現在振り返ると、古いバージョンを消していなかった状況が原因と思われる。
対応
ログイン
GUIでのログインはできないが、CUI経由のログインは可能。
CUIコンソールを出すため、Ctl+Alt+F1 (GUIに戻るにはAlt+F7とのこと)を押して、
ユーザー名、パスワードでログイン。
ホーム画面が表示されるが、解像度がおかしいため、本来表示されるはずの範囲の内、640x480がディスプレイに大画面に表示されてしまう。ディスプレイの設定からも、他のサイズを選択できないし、画面外にウィンドウが表示されてしまうため、調査できない状況だった。
また、CUI上の日本語の表示がすべて文字化けしていた。
1つ目の試行錯誤(結果関係なし)
ネットの情報を検索して、まずは、これを参考にした。
UbuntuでGUIログインできなくなった時の対処法
df
を実行して確認してみたが、領域仕様は1%以下だったので今回の事案に当たらなさそう。
2つ目の試行錯誤(こちらで解決)
Ubuntuアップデートしたらログインできなくなった(nvidia GPU使用)
つぎにこの情報を参考にした。
1. ファイルの削除
以下のファイルの削除を試してみたが、再起動したが直らず。
$ rm .Xauthority
$ rm .ICEauthority
$ sudo reboot
2. nvidiaのドライバのアンインストール・インストール
nvidiaのドライバ周りがおかしい可能性があったので、
UbuntuにNvidia GPUのDriver + CUDAをInstallする(GTX1080対応版)
を参考に。
まずは、現在の状況をチェック
$ dpkg -l | grep nvidia
$ dpkg -l | grep cuda
3. 古いドライバーの削除
$ sudo apt-get --purge remove nvidia-*
$ sudo apt-get --purge remove cuda-*
4.リポジトリの登録
$ sudo add-apt-repository ppa:graphics-drivers/ppa
$ sudo apt-get update
5. ドライバのインストール
新しく入れるドライバを調べる。
$ sudo add-apt-repository ppa:xorg-edgers/ppa
$ sudo apt-get update
$ sudo apt-cache search 'nvidia-[0-9]+$'
(2018.2.26時点では)nvidia-384が最新だったので
$ sudo apt-get install nvidia-384
再度、再起動を試してみる。
$ sudo reboot
直りました。解像度も戻っていたので、一安心。
6. ドライバの起動確認
ログイン後、
$ nvidia-smi
を実行し、GPUの状況が表示されれていたのでひとまずOKそう。
(新しい課題)ランチャーバーが消滅
こちらの情報も有用か?
nvidia関連全部、一掃している様子だけど、大丈夫だろうか?
Ubuntu14.04にCaffeをインストールしたらCUIでしか起動しなくなったからどうにかした話
と思って実行してみると、ログインループ問題が解決はしたけど、この度は背景だけ、ランチャーバーが表示されない問題が現れた。
下の情報に従って、調整、再起動で、無事に解決。
[Ubuntu 14.04でログイン後ランチャーもツールバーも表示されない問題の復旧]http://m12i.hatenablog.com/entry/2014/05/24/100539()
この後
cuda, cudnnなどの入れ直しなどをする予定。
deeplearningの環境(tensorflow, chainer, etc)は、
CUDA 6.0, cudnn 8.0の組み合わせが必要とのことだった(tensorflowのインストールの注意に書いてあった記憶)ので、その組み合わせでインストールを実行する予定(備忘録として、別投稿にて詳細を記載予定)。