はじめに
GitHubに書かれている手順がさっぱり・・・
見る人が見れば分かるのか???
そんな私、みなさんのためのメモです。
ですので新しい情報はないです。
GitHub見てください。
参考
- GitHub check_lsi_raid (https://github.com/thomas-krenn/check_lsi_raid)
- LSI_RAID_Monitoring_Plugin (https://www.thomas-krenn.com/de/wiki/LSI_RAID_Monitoring_Plugin)
環境
- OS CentOS7系
- check_lsi_raid
手順
- (0) 概要
- (1) check_lsi_raidダウンロード
- (2) check_lsi_raidビルド
- (3) 動作確認
- (4) 応用編
(0) 概要
LSI_RAID-Controllers系からステータス採取するためのツール
Controllers情報/HDD情報/Battery情報/温度など採取可能
(1) check_lsi_raidダウンロード
- 緑色のコード⇒ダウンロードZIP
+ git clone https://github.com/thomas-krenn/check_lsi_raid.git
(2) check_lsi_raidビルド
そのまま実行ファイルになっていますのでビルドは不要
(3) 動作確認
./check_lsi_raid
cd check_lsi_raid
tree check_lsi_raid
├── COPYING
├── README.md
├── changelog
└── check_lsi_raid
./check_lsi_raid
#エラー発生
---
Error: cannot find storcli executable.
Ensure storcli is in your path, or use the '-p <storcli path>' switch!
---
storcli pathが見つからないエラーなので-p
オプション追加
./check_lsi_raid
# 再度実行
./check_lsi_raid -p /opt/hpe/storcli/storcli64
#色々とステータス表示
---
Critical (PD Crit, BBU Crit) [c0/e246/s1_Drive_Temperature=47;40;45] ・・・・
---
今回のRAID_ComtrollerはBBUを搭載していない物になります
BBUが毎回エラーになるのは不便なので-b 0
オプション追加
./check_lsi_raid
# 再度実行
./check_lsi_raid -b 0 -p /opt/hpe/storcli/storcli64
#BBUのCritical表示がなくなりました。
---
Critical (PD Crit) [c0/e246/s1_Drive_Temperature=47;40;45] ・・・・
---
PDの閾値がDefault WARNING = 40 CRITICAL = 45で低いので-PDTw
オプション追加
./check_lsi_raid
# 再度実行
./check_lsi_raid -b 0 -PDTw 60 --p /opt/hpe/storcli/storcli64
# ステータスが全て正常になりました。。
---
- OK (CTR, LD, PD)・・・・
---
(4) 応用編
cat check_lsi_raid
# check_lsi_raidの先頭に各ステータスの閾値があります
# ここを変更すればコマンドにオプション不要で実行出来ます。
our $VERBOSITY = 0;
our $VERSION = "2.5";
our $NAME = "check_lsi_raid: Nagios/Icinga plugin to check LSI Raid Controller status";
our $C_TEMP_WARNING = 85; # Controller
our $C_TEMP_CRITICAL = 95; # Controller
our $C_MEM_CORRECTABLE_WARNING = 0; # Memory
our $C_MEM_CORRECTABLE_CRITICAL = 0; # Memory
our $PD_TEMP_WARNING = 40; # Disk
our $PD_TEMP_CRITICAL = 45; # Disk
our $BBU_TEMP_WARNING = 50; # Battery
our $BBU_TEMP_CRITICAL = 60; # Battery
our $CV_TEMP_WARNING = 70;
our $CV_TEMP_CRITICAL = 85;
our ($IGNERR_M, $IGNERR_O, $IGNERR_P, $IGNERR_S, $IGNERR_B) = (0, 0, 0, 0, 0);
# $IGNERR_M ignore-media-errors
# $IGNERR_O ignore-other-errors
# $IGNERR_P ignore-predictive-fail-count
# $IGNERR_S ignore-shield-counter
# $IGNERR_B ignore-bbm-counter
our $NOENCLOSURES = 0;
our $NOWRITEBACKOK = 0;
our $CONTROLLER = 0;
ひとまず実行すればステータスに問題ないか確認出来るようになりました。
詳しい情報が知りたい場合は-vvv
を付けると実行コマンド詳細が確認出来ます。
参考になれば
ではまた