動作環境
Xeon E5-2620 v4 (8コア) x 2
32GB RAM
GeForce GT 730 1GB GDDR5
CentOS 6.9 (64bit)
NCAR Command Language Version 6.3.0
for WRF3.7.1, WPS3.7.1
openmpi-1.8.x86_64 とその-devel
mpich.x86_64 3.1-5.el6とその-devel
gcc version 4.4.7 (とgfortran)
for WRF3.9, WPS3.9
Open MPI v2.1.1
gcc version 4.9.2 (とgfortran; devtoolset-3使用)
NetCDF v4.4.1.1, NetCDF (Fortran API) v4.4.4
Python 2.6.6 (r266:84292, Aug 18 2016, 15:13:37)
Python 3.6.0 on virtualenv
GNU bash, version 4.1.2(2)-release (x86_64-redhat-linux-gnu)
date (GNU coreutils) 8.4
tmux 1.6-3.el6
nouveauというのはCentOS 6.Xでデフォルトに使われるドライバのようだ。
このnouveauとGeForce GT 730の相性が良くないためか、原因不明のrebootが発生している。
関連: CentOS > 謎の再起動の再発 > ps -efのログ確認 | Link > CentOS ビデオドライバ(NVIDIA GeForce)関連
reboot対策の1つとしてビデオドライバをnouveauからkmod-nvidiaへ変更してみる。
(kmod-nvidiaを使うとkernelアップデート時に問題が少ないらしい)
参考
-
ThinkPad W520 + CentOS 7 夏対策(省電力設定)
- CentOS 7の情報ではあるが、CentOS 6.9でも
yum list
の確認は同じ方法で可能
- CentOS 7の情報ではあるが、CentOS 6.9でも
情報感謝です。
前準備
CentOS 6.X > 外部パッケージELRepoのrpmファイル名を見つける (2018-03-16版)
上記の「ELRepoのrpmファイル」節の2つのコマンドを実行してELRepoリポジトリを追加しておく。
実施
利用可能なバージョンを以下で確認する。
$ yum list kmod-nvidia --enablerepo=elrepo --showduplicates
Loaded plugins: fastestmirror, refresh-packagekit, security
Loading mirror speeds from cached hostfile
* base: ftp.riken.jp
* elrepo: ftp.yz.yamagata-u.ac.jp
* epel: ftp.riken.jp
* extras: ftp.riken.jp
* updates: ftp.riken.jp
Available Packages
kmod-nvidia.x86_64 367.57-1.el6.elrepo elrepo
kmod-nvidia.x86_64 384.90-1.el6.elrepo elrepo
kmod-nvidia.x86_64 384.98-1.el6.elrepo elrepo
kmod-nvidia.x86_64 384.111-1.el6.elrepo elrepo
kmod-nvidia.x86_64 390.25-1.el6.elrepo elrepo
390.25を使うことにした。
$ sudo yum install kmod-nvidia-390.25-1.el6.elrepo.x86_64 --enablerepo=elrepo
OS再起動後、以下であることを確認した。
$ dmesg | grep NVIDIA
NVRM: loading NVIDIA UNIX x86_64 Kernel Module 390.25 Wed Jan 24 20:02:43 PST 2018 (using threaded interrupts)
nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms 390.25 Wed Jan 24 19:29:37 PST 2018
画面表示は問題ない。
rebootの問題が解消するかどうか。しばらく様子を見ることになる。