あらすじ
自作PCにGPUを乗っけてから頻繁にフリーズするようになったので、ためしたことをメモ。
状況
起動は普通にできるのだが、しばらく使っていると突然(数日おきくらいに)突然フリーズし、入力を受け付けなくなる。
外部からのSSH接続もできず、電源長押しで強制シャットダウンするしかない。
ログを取って確認したが、CPU温度やメモリ使用量も正常。
sysrq+r+e+i+s+u+bも効かないので、カーネルが死んでいる?どうもカーネルパニックを起こしてるような気がする。
(参考:http://ukituriboku8136.blog.fc2.com/blog-entry-273.html)
やったこと
-
grub設定を変更する:Ubuntuのバグを踏んで似たような状況に陥っている可能性があるので、設定を変更した。
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
-->GRUB_CMDLINE_LINUX_DEFAULT="quiet splash intel_idle.max_cstate=1"
-
カーネルパニック時に再起動するように設定:
/etc/sysctl.conf
にkernel.panic = 10
を追記、sudo sysctl -p
で反映。 - sysrqを有効化:sysrq+r+e+i+s+u+bすら受け付けなかったのだが、もしかしてsysrqが無効になっていたからでは?(一応
/proc/sys/kernel/sysrq
はデフォルトの176に設定されており、sysrq+Bは有効のはずだが)、ということで、/etc/sysctl.conf
のkernel.sysrq = 1
のコメントアウトを外す。ついでにこれでsysrq+c
が有効になるので、意図的にカーネルパニックを起こして正しく再起動されるかテストした。
その後
うまくいってくれるといいのだが……