CentOS
NVIDIA
update
GeForce

CentOS 6.9 > ビデオドライバをnouveauからkmod-nvidiaへ変更

動作環境
Xeon E5-2620 v4 (8コア) x 2
32GB RAM
GeForce GT 730 1GB GDDR5
CentOS 6.9 (64bit)
NCAR Command Language Version 6.3.0
for WRF3.7.1, WPS3.7.1
  openmpi-1.8.x86_64 とその-devel
  mpich.x86_64 3.1-5.el6とその-devel
  gcc version 4.4.7 (とgfortran)
for WRF3.9, WPS3.9
  Open MPI v2.1.1
  gcc version 4.9.2 (とgfortran; devtoolset-3使用)
 NetCDF v4.4.1.1, NetCDF (Fortran API) v4.4.4
Python 2.6.6 (r266:84292, Aug 18 2016, 15:13:37) 
Python 3.6.0 on virtualenv
GNU bash, version 4.1.2(2)-release (x86_64-redhat-linux-gnu)
date (GNU coreutils) 8.4 
tmux 1.6-3.el6

nouveauというのはCentOS 6.Xでデフォルトに使われるドライバのようだ。
このnouveauとGeForce GT 730の相性が良くないためか、原因不明のrebootが発生している。

関連: CentOS > 謎の再起動の再発 > ps -efのログ確認 | Link > CentOS ビデオドライバ(NVIDIA GeForce)関連

reboot対策の1つとしてビデオドライバをnouveauからkmod-nvidiaへ変更してみる。
(kmod-nvidiaを使うとkernelアップデート時に問題が少ないらしい)

参考

情報感謝です。

前準備

CentOS 6.X > 外部パッケージELRepoのrpmファイル名を見つける (2018-03-16版)

上記の「ELRepoのrpmファイル」節の2つのコマンドを実行してELRepoリポジトリを追加しておく。

実施

利用可能なバージョンを以下で確認する。

$ yum list kmod-nvidia --enablerepo=elrepo --showduplicates
Loaded plugins: fastestmirror, refresh-packagekit, security
Loading mirror speeds from cached hostfile
 * base: ftp.riken.jp
 * elrepo: ftp.yz.yamagata-u.ac.jp
 * epel: ftp.riken.jp
 * extras: ftp.riken.jp
 * updates: ftp.riken.jp
Available Packages
kmod-nvidia.x86_64                                   367.57-1.el6.elrepo                                     elrepo
kmod-nvidia.x86_64                                   384.90-1.el6.elrepo                                     elrepo
kmod-nvidia.x86_64                                   384.98-1.el6.elrepo                                     elrepo
kmod-nvidia.x86_64                                   384.111-1.el6.elrepo                                    elrepo
kmod-nvidia.x86_64                                   390.25-1.el6.elrepo                                     elrepo

390.25を使うことにした。

$ sudo yum install kmod-nvidia-390.25-1.el6.elrepo.x86_64 --enablerepo=elrepo

OS再起動後、以下であることを確認した。

$ dmesg | grep NVIDIA
NVRM: loading NVIDIA UNIX x86_64 Kernel Module  390.25  Wed Jan 24 20:02:43 PST 2018 (using threaded interrupts)
nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms  390.25  Wed Jan 24 19:29:37 PST 2018

画面表示は問題ない。

rebootの問題が解消するかどうか。しばらく様子を見ることになる。