Zabbix監視テンプレート(Scality 6 RING)を作成しました。
Zabbix 3.0、Scality RING 6.4.5.4(Mithrandir)で検証しています。
前提条件
- /etc/logrotate.dの設定がrestartではなく、reloadを使用している事。
- Zabbixエージェントの設定ファイルにパラメータ"Include=/etc/zabbix/zabbix_agentd.d/"を設定している事。
Scality 6 RING
テンプレート
- Template App Scality 6 RING Nodes Service(テンプレートとのリンク: なし)
アプリケーション
- Scality 6 RING Nodes service
アイテム
# | アイテム名 | トリガー | キー | データ型 | 単位 | 乗数の使用 | 更新間隔(秒) | ヒストリ | トレンド | タイプ | アプリケーション | 内容 | 備考 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | httpd service is running | 1 | net.tcp.listen[81] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | TCP81ポート(httpd)のステータス取得 | TCP81ポート(httpd)を使用しない場合は不要 |
2 | sagentd service is running | 1 | net.tcp.listen[7084] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | TCP7084ポート(sagentd)のステータス取得 | TCP7084ポート(sagentd)を使用しない場合は不要 |
3 | srebuildd service is running | 1 | net.tcp.listen[10002] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | TCP10002ポート(srebuildd)のステータス取得 | TCP10002ポート(srebuildd)を使用しない場合は不要 |
4 | elasticsearch/cluster service is running | 1 | net.tcp.listen[9200] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | TCP9200ポート(elasticsearch/cluster)のステータス取得 | TCP9200ポート(elasticsearch/cluster)を使用しない場合は不要 |
5 | elasticsearch/instances service is running | 1 | net.tcp.listen[9300] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | TCP9300ポート(elasticsearch/instances)のステータス取得 | TCP9300ポート(elasticsearch/instances)を使用しない場合は不要 |
6 | Number of running httpd processes | 1 | proc.num[httpd,root,,"-DFOREGROUND"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | httpdプロセスの個数取得 | |
7 | Number of running biziod processes | 1 | proc.num[,root,,"biziod"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | biziodプロセスの個数取得 | |
8 | Number of running salt-minion processes | 1 | proc.num[,root,,"salt-minion"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | salt-minionプロセスの個数取得 | |
9 | Number of running sagentd processes | 1 | proc.num[,root,,"/usr/bin/sagentd"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentdプロセスの個数取得 | |
10 | Number of running sagentd/core processes | 1 | proc.num[,root,,"sagentd/core"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/coreプロセスの個数取得 | |
11 | Number of running sagentd/heartbeat processes | 1 | proc.num[,root,,"sagentd/heartbeat"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/heartbeatプロセスの個数取得 | |
12 | Number of running sagentd/poll processes | 1 | proc.num[,root,,"sagentd/poll"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/pollプロセスの個数取得 | |
13 | Number of running sagentd/scheduler processes | 1 | proc.num[,root,,"sagentd/scheduler"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/schedulerプロセスの個数取得 | |
14 | Number of running sagentd/webclient processes | 1 | proc.num[,root,,"sagentd/webclient"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/webclientプロセスの個数取得 | |
15 | Number of running sagentd/webserver processes | 1 | proc.num[,root,,"sagentd/webserver"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | sagentd/webserverプロセスの個数取得 | |
16 | Number of running srebuildd processes | 1 | proc.num[,root,,"srebuildd"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | srebuilddプロセスの個数取得 | |
17 | Number of running bizstorenode processes | 1 | proc.num[,root,,"bizstorenode"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | bizstorenodeプロセスの個数取得 | |
18 | Number of running elasticsearch processes | 1 | proc.num[java,elasticsearch,,"elasticsearch"] | 数値 | - | - | 30 | 90 | 365 | Zabbixエージェント | Scality 6 RING Nodes service | bizstorenodeプロセスの個数取得 |
- ヒストリとは各収集値の保持期間
- トレンドとは数値データタイプの1時間あたりの最低値、最高値、平均値および合計値の保持期間
- Zabbixにリトライ回数、リトライ間隔、タイムアウト時間は存在しない
トリガー
# | 深刻度 | トリガー | 条件式 | 種別 | 内容 | 備考 |
---|---|---|---|---|---|---|
1 | 軽度の障害 | httpd service is down on {HOST.NAME} | net.tcp.listen[81].max(#3)=0 | ポート | 直近3回のTCP81ポート(httpd)のステータス取得時の戻り値(最大値)が0(Close)だった場合 | TCP81ポート(httpd)を使用しない場合は不要 |
2 | 軽度の障害 | sagentd service is down on {HOST.NAME} | net.tcp.listen[7084].max(#3)=0 | ポート | 直近3回のTCP7084ポート(sagentd)のステータス取得時の戻り値(最大値)が0(Close)だった場合 | TCP7084ポート(sagentd)を使用しない場合は不要 |
3 | 軽度の障害 | srebuildd service is down on {HOST.NAME} | net.tcp.listen[10002].max(#3)=0 | ポート | 直近3回のTCP10002ポート(srebuildd)のステータス取得時の戻り値(最大値)が0(Close)だった場合 | TCP10002ポート(srebuildd)を使用しない場合は不要 |
4 | 軽度の障害 | elasticsearch/cluster service is down on {HOST.NAME} | net.tcp.listen[9200].max(#3)=0 | ポート | 直近3回のTCP9200ポート(elasticsearch/cluster)のステータス取得時の戻り値(最大値)が0(Close)だった場合 | TCP9200ポート(elasticsearch/cluster)を使用しない場合は不要 |
5 | 軽度の障害 | elasticsearch/instances service is down on {HOST.NAME} | net.tcp.listen[9300].max(#3)=0 | ポート | 直近3回のTCP9300ポート(elasticsearch/instances)のステータス取得時の戻り値(最大値)が0(Close)だった場合 | TCP9300ポート(elasticsearch/instances)を使用しない場合は不要 |
6 | 重度の障害 | httpd process is not running on {HOST.NAME} | proc.num[httpd,root,,"-DFOREGROUND"].last(0)<1 | プロセス | 稼働中のhttpdプロセスの最新個数が1未満だった場合 | |
7 | 重度の障害 | biziod process is not running on {HOST.NAME} | proc.num[,root,,"biziod"].last(0)<ディスクの総数 × 2 | プロセス | 稼働中のbiziodプロセスの最新個数がディスクの総数 × 2未満だった場合 | サーバーが管理するディスクの総数の2倍 |
8 | 重度の障害 | salt-minion process is not running on {HOST.NAME} | proc.num[,root,,"salt-minion"].last(0)<3 | プロセス | 稼働中のsalt-minionプロセスの最新個数が3未満だった場合 | |
9 | 重度の障害 | sagentd process is not running on {HOST.NAME} | proc.num[,root,,"/usr/bin/sagentd"].last(0)<1 | プロセス | 稼働中のsagentdプロセスの最新個数が1未満だった場合 | |
10 | 重度の障害 | sagentd/core process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/core"].last(0)<1 | プロセス | 稼働中のsagentd/coreプロセスの最新個数が1未満だった場合 | |
11 | 重度の障害 | sagentd/heartbeat process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/heartbeat"].last(0)<1 | プロセス | 稼働中のsagentd/heartbeatプロセスの最新個数が1未満だった場合 | |
12 | 重度の障害 | sagentd/poll process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/poll"].last(0)<1 | プロセス | 稼働中のsagentd/pollプロセスの最新個数が1未満だった場合 | |
13 | 重度の障害 | sagentd/scheduler process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/scheduler"].last(0)<1 | プロセス | 稼働中のsagentd/schedulerプロセスの最新個数が1未満だった場合 | |
14 | 重度の障害 | sagentd/webclient process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/webclient"].last(0)<1 | プロセス | 稼働中のsagentd/webclientプロセスの最新個数が1未満だった場合 | |
15 | 重度の障害 | sagentd/webserver process is not running on {HOST.NAME} | proc.num[,root,,"sagentd/webserver"].last(0)<1 | プロセス | 稼働中のsagentd/webserverプロセスの最新個数が1未満だった場合 | |
16 | 重度の障害 | srebuildd process is not running on {HOST.NAME} | proc.num[,root,,"srebuildd"].last(0)<2 | プロセス | 稼働中のsrebuilddプロセスの最新個数が2未満だった場合 | |
17 | 重度の障害 | bizstorenode process is not running on {HOST.NAME} | proc.num[,root,,"bizstorenode"].last(0)<12 or 24 | プロセス | 稼働中のbizstorenodeプロセスの最新個数が12 or 24未満だった場合 | サーバーが1つのRINGをサポートする場合は12個、2つのRINGをサポートする場合は24個 |
18 | 重度の障害 | elasticsearch process is not running on {HOST.NAME} | proc.num[java,elasticsearch,,"elasticsearch"].last(0)<2 | プロセス | 稼働中のelasticsearchプロセスの最新個数が2未満だった場合 |
関連記事
Zabbix監視テンプレート(Scality 6 Supervisor)
Zabbix監視テンプレート(Scality 6 SOFS Connector)