Oracle Cloud Infrastructureにはほぼ無償で使えるOCI Monitoringという機能があります。
アラート機能と組み合わせると特定の条件になった時にメールやSMSで通知する事ができます。
ここではコンピュートが止まった場合に通知方法をご紹介します。
アラートの設定
OCIコンソール左上の3本線(ハンバーガーメニュー)をクリックしてメニューを出し、「監視および管理」を選択すると右側にメニューが展開されるのでその中の「モニタリング」を選択します。
モニタリングの左メニューの中に「アラーム定義」があるのでそちらを選択します。
右側の画面にアラームの作成というボタンが出るのでそれを押下します。
下記の赤枠が変更を加えてある箇所ですが、「アラーム名」以外はプルダウンメニューで選択する形になります。
上から順番に選択していくと、次のプルダウンメニューが出てきます。
右下のディメンション値というのは監視対象のサーバー名でコンピュートを作成した時にユーザーが定義した名前になり、このコンパートメント内にあるコンピュート一覧がプルダウンで表示されるので該当のサーバーを選択します。
下の方に行くとトリガー・ルールの作成をする箇所になります。
何をもってサーバー止まっているかというのは利用される方毎に定義が違うと思いますが、ここではOSが稼働している時には何かしらの値が入っている「CpuUtilization」の値が何も上がってこなくなる「なし」になった場合をサーバー停止と考え、その状態になったら発報するように上記定義を行います。
「アラーム本体」はメールに記載される内容なので受け取った人がわかる内容にしておくと親切かも知れません。
送信先の設定
更に下に移動すると「アラーム通知の定義」という項目があります。
事前に「トピック」という名称になっている連絡先を登録してあればプルダウンで出てくるので選択できますが、今回はこの場で新規トピック(通知先)を定義していきます。
右側の「トピックの作成」をクリックします。
するとメニューが下に展開されて新しいトピック(通知先)を入力する事ができるようになります。
今回はdemo_topicというトピック名でメールアドレスを登録しました。
入力が完了したら「トピックとサブスクリプションの作成」を押下します。
すると、設定したメールアドレスに確認メールが飛ぶので「Confirm subscription」のリンクをクリックします。
作成したアラーム定義はこちらでアラーム名の左側の緑のチェックは既に監視している事を意味します。
実際に発報させてみる
ちゃんとメールが飛ぶかサーバーを止めて見ましょう。
コンピュートの一覧からアラートで定義したサーバーを選択して「停止」をしてみます。
シャットダウン処理の少し時間がかかるのと検出間隔もあるため、実際に停止処理を始めてから4分後に以下のメールが届きました。
左側のモニタリングメニューの中にある「アラームのステータス」を選択すると、今現在、発報されているアラームが表示されます。
何も発報が無い場合はこちらは空になります。
アラーム名をクリックするとアラームの定義のページに飛びます。
アラーム名の横に炎のマークが出ていて発報されているのがわかります。
発報の確認ができたのでサーバー起動して正常な状態に戻します。
また4分くらいかかりましたが、StateがOKになっている復旧した通知が届きました。
アラームのステータスを確認すると先ほどまで表示されていた「demo_alarm」が消えています。
このように簡単にサーバの死活監視を競ってする事ができます。
利用料金
冒頭で「ほぼ無償」と書いているのはデータポイント数が多いとほんの少しだけ費用がかかりますが、誤差程度です。
下記スライドに料金がでていますが、毎月10億データポイントまで無償です。
10憶データポイントをオーバーしても100万データポイントあたり0.0015ドルなので「ほぼ無償」と表現しています。
詳細は上記資料が詳しいです。