0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Zabbixで障害発生および復旧をメール通知

Posted at

Zabbix

訳あって、Zabbixに触れることになった。障害発生および復旧をメール通知する、という簡単と思われたことに少々苦闘したので、記録する。

インストール

記事「ubuntu22.04にZabbix server6.4を構築する」を参考に、”Ubuntu 24.04.1 LTS”にインストール。

お題

あるPC(192.168.10.202)を、pingにより監視し、疎通がなくなったら障害発生メールを送り、疎通が回復したら復旧メールを送る、、、という単純なもの。

設定

一部、順不同であるが、小生が設定した順番で記載。

通知用メール設定(メディアタイプ)

送信用メールアカウント設定。メディアタイプをクリック。

ここでは、既存の”Email(HTML)”を利用。

メディアタイプ1のコピー.png

メールサーバー、メールアドレス、アカウント、パスワードなどメール送信に必要な情報を入力する。作成されたものが下記。

メディアタイプリスト0のコピー.png

なお、メディアタイプのデフォルトテンプレートは下記となっている。

メディアタイプメッセージテンプレート.png

新規にメディアタイプを作成した時には、何かしらのテンプレートを追加する必要がある。

また、オプションではあるが、右端の”テスト”により、メール送信のテストができる。

メディアタイプテスト1のコピー.png

テストメールの受信。

テスト受信のコピー.png

通知用のユーザー登録

通知先の登録。ユーザークリック。

ここでは、新たなユーザーを作成した。

ユーザー作成.png

ユーザー名(ここでは”Notify1”)を入力。グループは”Internal”および”Zabbix_administrators”とした。

ユーザー名&グループ.png

通知先は、メディアで設定する。

ユーザーメディア設定のコピー.png

適宜、深刻度を設定。ここでは、警告以上に利用。

ユーザーメディアのコピー.png

メール通知するためには、ユーザーの役割を”Super admin role”とする必要があるようだ(他の役割では通知できなかった、、真偽不明)。

ユーザー役割.png

ユーザーリストは下記となる。

ユーザーリスト.png

監視ホスト登録

監視ホストとしてのPC(192.168.10.202)を登録する。ホストクリック。

ホストの作成。

ホストの作成.png

新しいホストの作成.png

ホスト名を入力し、エージェントとして、PCのIPアドレスを入力。

新しいホストの作成0エージェント.png

新しいホストの作成2.png

ホストグループは”Applications”とした。

新しいホストの作成1.png

作成したホストは下記となる。

ホストリスト.png

監視ホストの監視内容設定(アイテム)

監視内容(ping)を設定。ホストが一覧表示されている状態で、該当ホストをクリックすると下記表示となる。

アイテムをクリックし、アイテム作成。

アイテム作成.png

名前を入力し、タイプ”シンプルチェック”を選ぶ。

新規アイテム1.png

キーの選択をクリック。

新規アイテム2(ダブルクリック).png

”icmping”をクリック。

新規アイテム3.png

IPアドレスなどのパラメーターを入力。

新規アイテム4.png

”icmpping”のパラメータについては、本家サイトを参照。

他の必須項目も入力(デフォルトのまま)。

新規アイテム5.png

作成後のリストは下記となる。

アイテムリスト.png

通知設定(トリガー)

監視内容にそったトリガーの設定。

トリガー作成.png

名称入力。

トリガー1.png

トリガー条件(条件式)追加。

トリガー2.png

アイテムをクリックし、先ほど設定したアイテム名称”PingToPC1”を選択。

トリガー3.png

一つ前の値(last())と最新との値を比較し、結果が0だったら、トリガー発動となる。

トリガー4.png

深刻度は、”致命的な障害”とする。

トリガー5.png

作成後のリストは下記となる。

トリガーリスト.png

グラフ(オプション)

グラフも作成しておく。

グラフ作成.png

名称入力。

グラフ1.png

監視アイテム追加。

グラフ2.png

グラフ3.png

グラフ4.png

作成したグラフのリストは下記となる。

グラフリスト.png

トリガーアクション登録

トリガーアクションクリック。

作成。

トリガーアクション作成.png

名称入力。

アクション1.png

実行条件を追加し、作成したトリガー”TriggerPC1”を選択する。

アクション1−3.png

アクション1−4.png

実行内容を設定(追加)。

アクション2.png

ステップを”1 - 0”とすると、障害が解消されるまで、ステップの間隔(ここでは5分ごと)でアクション(ここでは”Notifiy1”に送信)する。送信時に用いるメディアタイプは作成した”Email(HTML)”。

トリガーアクション11.png

実行条件は、下記のように、”イベント未確認”としておけば動作するようだ。

アクション5−3.png

トリガーアクション12.png

同じように、復旧時の実行内容も登録。

トリガーアクション13.png

作成したトリガーアクションは下記となる。

アクションリスト.png

検証

指定ホストに障害を発生させ、ping失敗(及び復旧)の状況を作り出す。その時の状況を記載。

通知(障害発生および復旧)

通知メールを下記。

メールサンプル2のコピー.png

17:21に発生通知、5分後の17:26に再通知、17:28に復旧通知。

アクションログ

上記の障害状況と異なるが、アクションログのサンプルは下記となる。

アクションログのコピー.png

グラフ

障害発生および復旧の状況のサンプルグラフである。

障害&復旧グラフ.png

EOF

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?