Edited at

Zabbix監視テンプレート(MD Software RAID)

More than 1 year has passed since last update.

MD Software RAID向けのZabbix監視テンプレート(MD Software RAID)を作成しました。

Zabbix 3.4で検証しています。


前提条件


  • /etc/logrotate.dの設定がrestartではなく、reloadを使用している事。

  • ソフトウェアRAID、またはmdデバイスを使用している事。

  • Zabbixエージェントの設定ファイルにパラメータ"Include=/etc/zabbix/zabbix_agentd.d/"を設定している事。


MD Software RAID


テンプレート


  • Template MD Software RAID(テンプレートとのリンク: なし)


アプリケーション


  • MD


アイテム

・なし


トリガー

・なし


ディスカバリ


ディスカバリルール

#
名前
タイプ
キー
更新間隔(秒)
例外の更新間隔
存在しなくなったリソースの保持期間(日)
説明
備考

1
Custom MD for discovery
Zabbixエージェント
custom.md.discovery
3600
-
30
Discovery of custom MD of different types as defined in global regular expression "Custom MD for discovery".


フィルター


  • なし


アイテムのプロトタイプ

#
名前
ディスカバリルール
トリガー
キー
データ型
単位
乗数の使用
更新間隔(秒)
ヒストリ
トレンド
タイプ
アプリケーション
内容
備考

1
MD $1 degraded
Custom MD for discovery
1
custom.md.degraded[{#MDNAME}]
数値
-
-
30
90
365
Zabbixエージェント
FlashMAX PCIe SSD
アレイおよびディスクドライブの縮退状況

2
MD $1 raid disks
Custom MD for discovery
1
custom.md.raid_disks[{#MDNAME}]
数値
-
-
30
90
365
Zabbixエージェント
FlashMAX PCIe SSD
変更されたディスクドライブの個数

3
MD $1 sync action
Custom MD for discovery
1
custom.md.sync_action[{#MDNAME}]
文字列
-
-
30
90
-
Zabbixエージェント
FlashMAX PCIe SSD
ディスクドライブの同期状況


  • ヒストリとは各収集値の保持期間

  • トレンドとは数値データタイプの1時間あたりの最低値、最高値、平均値および合計値の保持期間

  • Zabbixにリトライ回数、リトライ間隔、タイムアウト時間は存在しない


トリガーのプロトタイプ

#
深刻度
トリガー
ディスカバリルール
条件式
種別
内容
備考

1
重度の障害
Custom MD for discovery
MD {#MDNAME} is degraded on {HOST.NAME}
custom.md.degraded[{#MDNAME}].last()>0
デバイス
直近のアレイおよびディスクドライブの縮退状況が1以上だった場合 ※最適なアレイは0、単一の故障/欠落は1

2
警告
Custom MD for discovery
MD {#MDNAME} number of disks changed on {HOST.NAME}
custom.md.raid_disks[{#MDNAME}].diff()>0
デバイス
直近の変更されたディスクドライブの個数が前回値と異なった場合

3
情報
Custom MD for discovery
MD {#MDNAME} in recovery mode on {HOST.NAME}
custom.md.sync_action[{#MDNAME}].str("recover")=1
デバイス
直近のディスクドライブの同期状況が"recover"だった場合 ※recover...故障した/紛失したデバイスを交換するためにホットスペアが構築された状態


コンフィグの設置


/etc/zabbix/zabbix_agentd.d/userparameter_md.conf

# Custom Discovery Rules

UserParameter=custom.md.discovery,cat /proc/mdstat | grep -B 1 -E "(U+|_+)" | awk 'BEGIN { printf "{\"data\":["}; /^md/ { printf c"{\"{#MDNAME}\":\""$1"\"}";c=","}; END{ print "]}" }'

# Custom Monitoring Items
UserParameter=custom.md.degraded[*],cat /sys/block/$1/md/degraded
UserParameter=custom.md.raid_disks[*],cat /sys/block/$1/md/raid_disks
UserParameter=custom.md.sync_action[*],cat /sys/block/$1/md/sync_action



zabbix-agentの再起動(CentOS 5, 6)

[root@localhost ~]# /etc/init.d/zabbix-agent restart


zabbix-agentの再起動(CentOS 7)

[root@localhost ~]# systemctl restart zabbix-agent