背景
Isaac SimというNVIDIA社が提供するシミュレーションプラットフォームを使用しているときにプログラムのエラーが起き,NVIDIAドライバのバージョンのせいだと早とちりして安易にドライバをバージョンアップしてしまった.その結果,設定を開こうとしたり,GPUを使おうとするとPCがクラッシュするようになってしまった; ;
タスクマネージャーを見ると,CPUの使用率が100%になっており,まともに操作できない.
実行環境
OS: Ubuntu 22.04
GPU: Geforce RTX4070
CPU: 13th Gen Intel® Core™ i9-13900HX
メモリ: 32GB
NVIDIAドライバのインストール方法
NVIDIAドライバのインストール方法として,
- aptからインストール
- 公式サイトからデータを取ってくる
の2通りあると思う.
aptでインストール
aptでインストールする際は,ubuntu-drivers devices
で推奨ドライバを確認し,ppaなどからインストールすることになる.
// 既存のドライバのアンインストール
sudo apt --purge remove nvidia-*
// 推奨ドライバの確認
ubuntu-drivers devices
// インストール
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-driver-<バージョン>
// 再起動
sudo reboot now
公式サイトからインストール
公式サイトからインストールする際は.run
ファイルを落としてきてダウンロードする.自分の環境を入力すると,公式オススメのドライバを取得できる.
// 既存のドライバのアンインストール
sudo apt --purge remove nvidia-*
// .runファイルに実行権限を付与
sudo chmod +x <ファイル名>.run
// インストール
sudo <ファイル名>.run
// 再起動
sudo reboot now
解決するまでにやったこと
本来であれば,上記の手順を踏めば適切なドライバがインストールされてGPUを使用できるようになるが,ここでクラッシュする問題が発生した.
解決するまでに色々と調べながら行ったこととして,
- 他のバージョンを試す
ubuntu-drivers devices
を実行すると,以下のように出力される.
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00002860sv00001028sd00000BF9bc03sc00i00
vendor : NVIDIA Corporation
driver : nvidia-driver-555-open - third-party non-free
driver : nvidia-driver-535-server-open - distro non-free
driver : nvidia-driver-560-open - third-party non-free
driver : nvidia-driver-550 - third-party non-free
driver : nvidia-driver-525 - third-party non-free
driver : nvidia-driver-545 - third-party non-free
driver : nvidia-driver-535-server - distro non-free
driver : nvidia-driver-535-open - distro non-free
driver : nvidia-driver-535 - third-party non-free
driver : nvidia-driver-555 - third-party non-free
driver : nvidia-driver-565 - third-party non-free recommended
driver : nvidia-driver-545-open - distro non-free
driver : nvidia-driver-560 - third-party non-free
driver : nvidia-driver-565-open - third-party non-free
driver : nvidia-driver-550-open - third-party non-free
driver : xserver-xorg-video-nouveau - distro free builtin
ここで,recommended
が推奨されるらしいが,場合によっては他のものがいいときもあるようだ.open
がついているものはダメといったコメントもあったので,third-party
のものを極力選ばないようにしながらいくつかのバージョンを試してみたがダメだった; ;
他に行ったこととして,
- Nouveau の無効化
- Secure Bootの無効化
- Toolkitのアンインストール/バージョン変更
- カーネルのバージョン更新
- OSの初期化
- BIOSの初期化
- PCの初期化
など,他にも試行錯誤したがダメだった.Secure Bootを無効化したときにはUbuntuを立ち上げられなくなった.しかし,ドライバをアンインストールするとクラッシュしなくなるので原因はやはりドライバだろう.
どうやって解決したのか
PCの初期化までやっても直ることなく,絶望して放心していたとき,ふとこれまで避けてきたthird-party
でopen
な最新のドライバを入れてみた.すると,
動いた!!!!!!!!!!!!
実際に使用したドライバは,
nvidia-driver-565-open - third-party non-free
です.
まとめ
今回は違うバージョンを入れることで解決できましたが,調べていた感じだと問題は多岐にわたるようです(この仕様はなんとかなんないのかなぁ).
今回得た教訓として,
- ネットの内容を安易に信じない
- アップデートする際などはバックアップをちゃんととる(めんどくさくてサボりがち)
- 安易にアップデートやアップグレードをしない
- AIの言うことも鵜呑みにしない(結構ハルシネーションがある)
同じトラブルに見舞われている人にこの記事が役に立ってくれると嬉しいです!!!