zabbix
RAID
md

Zabbix監視テンプレート(MD Software RAID)

MD Software RAID向けのZabbix監視テンプレート(MD Software RAID)を作成しました。
Zabbix 3.4で検証しています。

前提条件

  • /etc/logrotate.dの設定がrestartではなく、reloadを使用している事。
  • ソフトウェアRAID、またはmdデバイスを使用している事。
  • Zabbixエージェントの設定ファイルにパラメータ"Include=/etc/zabbix/zabbix_agentd.d/"を設定している事。

MD Software RAID

テンプレート

  • Template MD Software RAID(テンプレートとのリンク: なし)

アプリケーション

  • MD

アイテム

・なし

トリガー

・なし

ディスカバリ

ディスカバリルール

# 名前 タイプ キー 更新間隔(秒) 例外の更新間隔 存在しなくなったリソースの保持期間(日) 説明 備考
1 Custom MD for discovery Zabbixエージェント custom.md.discovery 3600 - 30 Discovery of custom MD of different types as defined in global regular expression "Custom MD for discovery".

フィルター

  • なし

アイテムのプロトタイプ

# 名前 ディスカバリルール トリガー キー データ型 単位 乗数の使用 更新間隔(秒) ヒストリ トレンド タイプ アプリケーション 内容 備考
1 MD $1 degraded Custom MD for discovery 1 custom.md.degraded[{#MDNAME}] 数値 - - 30 90 365 Zabbixエージェント FlashMAX PCIe SSD アレイおよびディスクドライブの縮退状況
2 MD $1 raid disks Custom MD for discovery 1 custom.md.raid_disks[{#MDNAME}] 数値 - - 30 90 365 Zabbixエージェント FlashMAX PCIe SSD 変更されたディスクドライブの個数
3 MD $1 sync action Custom MD for discovery 1 custom.md.sync_action[{#MDNAME}] 文字列 - - 30 90 - Zabbixエージェント FlashMAX PCIe SSD ディスクドライブの同期状況
  • ヒストリとは各収集値の保持期間
  • トレンドとは数値データタイプの1時間あたりの最低値、最高値、平均値および合計値の保持期間
  • Zabbixにリトライ回数、リトライ間隔、タイムアウト時間は存在しない

トリガーのプロトタイプ

# 深刻度 トリガー ディスカバリルール 条件式 種別 内容 備考
1 重度の障害 Custom MD for discovery MD {#MDNAME} is degraded on {HOST.NAME} custom.md.degraded[{#MDNAME}].last()>0 デバイス 直近のアレイおよびディスクドライブの縮退状況が1以上だった場合 ※最適なアレイは0、単一の故障/欠落は1
2 警告 Custom MD for discovery MD {#MDNAME} number of disks changed on {HOST.NAME} custom.md.raid_disks[{#MDNAME}].diff()>0 デバイス 直近の変更されたディスクドライブの個数が前回値と異なった場合
3 情報 Custom MD for discovery MD {#MDNAME} in recovery mode on {HOST.NAME} custom.md.sync_action[{#MDNAME}].str("recover")=1 デバイス 直近のディスクドライブの同期状況が"recover"だった場合 ※recover...故障した/紛失したデバイスを交換するためにホットスペアが構築された状態

コンフィグの設置

/etc/zabbix/zabbix_agentd.d/userparameter_md.conf
# Custom Discovery Rules
UserParameter=custom.md.discovery,cat /proc/mdstat | grep -B 1 -E "(U+|_+)" | awk 'BEGIN { printf "{\"data\":["}; /^md/ { printf c"{\"{#MDNAME}\":\""$1"\"}";c=","}; END{ print "]}" }'

# Custom Monitoring Items
UserParameter=custom.md.degraded[*],cat /sys/block/$1/md/degraded
UserParameter=custom.md.raid_disks[*],cat /sys/block/$1/md/raid_disks
UserParameter=custom.md.sync_action[*],cat /sys/block/$1/md/sync_action

zabbix-agentの再起動(CentOS 5, 6)

[root@localhost ~]# /etc/init.d/zabbix-agent restart

zabbix-agentの再起動(CentOS 7)

[root@localhost ~]# systemctl restart zabbix-agent