本ブログは、オラクル・クラウドの個人ブログの1つです。
初めに
OCI上のComputeインスタンスがダウンした場合、自動的に検知して通知先に通知するのは一般的な監視の要件です。OCIネイティブの監視サービス(モニタリング)を利用すれば、簡単にこれを実現できますので、それをご紹介したいと思います。
ステップ
1. 事前準備
まず、OCI通信サービス(Notification)の用語を理解する。
- トピック (Topic):メッセージをサブスクリプションに送信するための通信チャネル。
-
サブスクリプション (Subscription):トピックのエンドポイント。公開されたメッセージは、トピックの各サブスクリプションに送信される。
サポートされているサブスクリプション・プロトコル:電子メール、ファンクション、HTTPS (カスタムURL)、PagerDuty、Slack、SMS
※、この例では、電子メール(デフォルト)を利用する。
1-1. トピックの作成
開発者サービス > アプリケーション統合 > 通知
「トピックの作成」をクリックし、名前を入力した後、作成をクリックする。
トピック名前は、一つテナンシ内に一意する。
1-2. サブスクリプションの作成
「サブスクリプションの作成」をクリックし、作成画面を開く。デフォルトの電子メールを使用するため、電子メールアドレスを入力したら、「作成」をクリックする。
1-3. サブスクリプションの確認
指定した受信者に次のようなメールが届いたら、"Confirm subscription"をクリックする。
送信者:noreply@notification.<リージョン識別子>.oci.oraclecloud.com
サブスクリプションの状態は、"Active"に変わったことを確認。
2. アラームの作成
監視および管理 > モニタリング > アラーム定義 > アラームの作成
入力項目の詳細
項目名 | 必須 | コメント |
---|---|---|
アラーム名 | Yes | 通知メールの表題と本文に表示 |
アラームの重大度 | Yes | 通知メールの表題と本文に表示 |
アラーム本体 | No | 入力した場合、通知メールの本文に表示 |
項目名 | 内容 | コメント |
---|---|---|
メトリック・ネームスペース | oci_computeagent | |
メトリック名 | CpuUtilization | |
ディメンション名 | resourceDisplayName | リソース名以外も選択できる |
ディメンション値 | インスタンス名 | |
トリガー・ルールの演算子 | なし |
作成したトピックを指定し、アラームを作成する。
通知の繰り返しをするのはできるが、この例ではデフォルトのまま(繰り返さない)にする。
作成後、次のように表示される。
※、この時点のアラーム・ステータスはOKであり、トリガーされた後、FIREに変わる。
3. インスタンスを停止し、通知を確認
インスタンス停止が検知されたら、以下のような通知メールが受信者に届く。
項目名 | 内容 |
---|---|
送信者 | noreply@notification.<リージョンID>.oci.oraclecloud.com |
表題 | Alarm: OK_TO_FIRING | <重大度> | <アラーム名> | <UTC時刻> |
メッセージ・タイプは、以下の4つがある。
OK_TO_FIRING, FIRING_TO_OK, REPEAT と RESET。詳しくは、こちらをご参照。
以上です。
関連記事
オラクル・クラウドの個人ブログ一覧
OCIカスタム・メトリックでディスク使用率を監視
公式ドキュメント
モニタリングの概要