Edited at

Zabbix監視テンプレート(Scality 6 RING)

More than 1 year has passed since last update.

Zabbix監視テンプレート(Scality 6 RING)を作成しました。

Zabbix 3.0、Scality RING 6.4.5.4(Mithrandir)で検証しています。


前提条件


  • /etc/logrotate.dの設定がrestartではなく、reloadを使用している事。

  • Zabbixエージェントの設定ファイルにパラメータ"Include=/etc/zabbix/zabbix_agentd.d/"を設定している事。


Scality 6 RING


テンプレート


  • Template App Scality 6 RING Nodes Service(テンプレートとのリンク: なし)


アプリケーション


  • Scality 6 RING Nodes service


アイテム

#
アイテム名
トリガー
キー
データ型
単位
乗数の使用
更新間隔(秒)
ヒストリ
トレンド
タイプ
アプリケーション
内容
備考

1
httpd service is running
1
net.tcp.listen[81]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
TCP81ポート(httpd)のステータス取得
TCP81ポート(httpd)を使用しない場合は不要

2
sagentd service is running
1
net.tcp.listen[7084]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
TCP7084ポート(sagentd)のステータス取得
TCP7084ポート(sagentd)を使用しない場合は不要

3
srebuildd service is running
1
net.tcp.listen[10002]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
TCP10002ポート(srebuildd)のステータス取得
TCP10002ポート(srebuildd)を使用しない場合は不要

4
elasticsearch/cluster service is running
1
net.tcp.listen[9200]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
TCP9200ポート(elasticsearch/cluster)のステータス取得
TCP9200ポート(elasticsearch/cluster)を使用しない場合は不要

5
elasticsearch/instances service is running
1
net.tcp.listen[9300]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
TCP9300ポート(elasticsearch/instances)のステータス取得
TCP9300ポート(elasticsearch/instances)を使用しない場合は不要

6
Number of running httpd processes
1
proc.num[httpd,root,,"-DFOREGROUND"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
httpdプロセスの個数取得

7
Number of running biziod processes
1
proc.num[,root,,"biziod"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
biziodプロセスの個数取得

8
Number of running salt-minion processes
1
proc.num[,root,,"salt-minion"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
salt-minionプロセスの個数取得

9
Number of running sagentd processes
1
proc.num[,root,,"/usr/bin/sagentd"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentdプロセスの個数取得

10
Number of running sagentd/core processes
1
proc.num[,root,,"sagentd/core"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/coreプロセスの個数取得

11
Number of running sagentd/heartbeat processes
1
proc.num[,root,,"sagentd/heartbeat"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/heartbeatプロセスの個数取得

12
Number of running sagentd/poll processes
1
proc.num[,root,,"sagentd/poll"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/pollプロセスの個数取得

13
Number of running sagentd/scheduler processes
1
proc.num[,root,,"sagentd/scheduler"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/schedulerプロセスの個数取得

14
Number of running sagentd/webclient processes
1
proc.num[,root,,"sagentd/webclient"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/webclientプロセスの個数取得

15
Number of running sagentd/webserver processes
1
proc.num[,root,,"sagentd/webserver"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
sagentd/webserverプロセスの個数取得

16
Number of running srebuildd processes
1
proc.num[,root,,"srebuildd"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
srebuilddプロセスの個数取得

17
Number of running bizstorenode processes
1
proc.num[,root,,"bizstorenode"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
bizstorenodeプロセスの個数取得

18
Number of running elasticsearch processes
1
proc.num[java,elasticsearch,,"elasticsearch"]
数値
-
-
30
90
365
Zabbixエージェント
Scality 6 RING Nodes service
bizstorenodeプロセスの個数取得


  • ヒストリとは各収集値の保持期間

  • トレンドとは数値データタイプの1時間あたりの最低値、最高値、平均値および合計値の保持期間

  • Zabbixにリトライ回数、リトライ間隔、タイムアウト時間は存在しない


トリガー

#
深刻度
トリガー
条件式
種別
内容
備考

1
軽度の障害
httpd service is down on {HOST.NAME}
net.tcp.listen[81].max(#3)=0
ポート
直近3回のTCP81ポート(httpd)のステータス取得時の戻り値(最大値)が0(Close)だった場合
TCP81ポート(httpd)を使用しない場合は不要

2
軽度の障害
sagentd service is down on {HOST.NAME}
net.tcp.listen[7084].max(#3)=0
ポート
直近3回のTCP7084ポート(sagentd)のステータス取得時の戻り値(最大値)が0(Close)だった場合
TCP7084ポート(sagentd)を使用しない場合は不要

3
軽度の障害
srebuildd service is down on {HOST.NAME}
net.tcp.listen[10002].max(#3)=0
ポート
直近3回のTCP10002ポート(srebuildd)のステータス取得時の戻り値(最大値)が0(Close)だった場合
TCP10002ポート(srebuildd)を使用しない場合は不要

4
軽度の障害
elasticsearch/cluster service is down on {HOST.NAME}
net.tcp.listen[9200].max(#3)=0
ポート
直近3回のTCP9200ポート(elasticsearch/cluster)のステータス取得時の戻り値(最大値)が0(Close)だった場合
TCP9200ポート(elasticsearch/cluster)を使用しない場合は不要

5
軽度の障害
elasticsearch/instances service is down on {HOST.NAME}
net.tcp.listen[9300].max(#3)=0
ポート
直近3回のTCP9300ポート(elasticsearch/instances)のステータス取得時の戻り値(最大値)が0(Close)だった場合
TCP9300ポート(elasticsearch/instances)を使用しない場合は不要

6
重度の障害
httpd process is not running on {HOST.NAME}
proc.num[httpd,root,,"-DFOREGROUND"].last(0)<1
プロセス
稼働中のhttpdプロセスの最新個数が1未満だった場合

7
重度の障害
biziod process is not running on {HOST.NAME}
proc.num[,root,,"biziod"].last(0)<ディスクの総数 × 2

プロセス
稼働中のbiziodプロセスの最新個数がディスクの総数 × 2未満だった場合
サーバーが管理するディスクの総数の2倍

8
重度の障害
salt-minion process is not running on {HOST.NAME}
proc.num[,root,,"salt-minion"].last(0)<3
プロセス
稼働中のsalt-minionプロセスの最新個数が3未満だった場合

9
重度の障害
sagentd process is not running on {HOST.NAME}
proc.num[,root,,"/usr/bin/sagentd"].last(0)<1
プロセス
稼働中のsagentdプロセスの最新個数が1未満だった場合

10
重度の障害
sagentd/core process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/core"].last(0)<1
プロセス
稼働中のsagentd/coreプロセスの最新個数が1未満だった場合

11
重度の障害
sagentd/heartbeat process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/heartbeat"].last(0)<1
プロセス
稼働中のsagentd/heartbeatプロセスの最新個数が1未満だった場合

12
重度の障害
sagentd/poll process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/poll"].last(0)<1
プロセス
稼働中のsagentd/pollプロセスの最新個数が1未満だった場合

13
重度の障害
sagentd/scheduler process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/scheduler"].last(0)<1
プロセス
稼働中のsagentd/schedulerプロセスの最新個数が1未満だった場合

14
重度の障害
sagentd/webclient process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/webclient"].last(0)<1
プロセス
稼働中のsagentd/webclientプロセスの最新個数が1未満だった場合

15
重度の障害
sagentd/webserver process is not running on {HOST.NAME}
proc.num[,root,,"sagentd/webserver"].last(0)<1
プロセス
稼働中のsagentd/webserverプロセスの最新個数が1未満だった場合

16
重度の障害
srebuildd process is not running on {HOST.NAME}
proc.num[,root,,"srebuildd"].last(0)<2
プロセス
稼働中のsrebuilddプロセスの最新個数が2未満だった場合

17
重度の障害
bizstorenode process is not running on {HOST.NAME}
proc.num[,root,,"bizstorenode"].last(0)<12 or 24

プロセス
稼働中のbizstorenodeプロセスの最新個数が12 or 24未満だった場合
サーバーが1つのRINGをサポートする場合は12個、2つのRINGをサポートする場合は24個

18
重度の障害
elasticsearch process is not running on {HOST.NAME}
proc.num[java,elasticsearch,,"elasticsearch"].last(0)<2
プロセス
稼働中のelasticsearchプロセスの最新個数が2未満だった場合


関連記事

Zabbix監視テンプレート(Scality 6 Supervisor)

Zabbix監視テンプレート(Scality 6 SOFS Connector)