概要
OpsRampでは監視対象機器のステータスを以下のように一目で確認ができます。
本記事ではこのステータスの意味と使い方について説明します。
OpsRampにおけるデバイスのステータスについて
OpsRamp上では機器のステータスが[Up,Down,Unknown,Undefined]の4種類で表示されます。
ただし単純に機器に異常があるからDownという風にはなりません。
仕様としては以下に従ってステータスは変化します。
Up:可用性に関するアラートを検知していない状態(可用性に関連しないアラートを検知している場合も含む)
Down:可用性に関するアラートを検知している状態
Unknown:可用性に関する監視にて監視が正常に行えていない状態
Undefined:可用性に関する監視が設定されていない状態
監視機能に関する可用性の設定
前章からわかるようにOpsRampの監視は可用性に関する監視と可用性には関連しない監視の2つに分かれます。
まずはOpsRamp社がデフォルトで用意している監視の設定を例に説明します。
死活(Ping)監視の詳細設定を確認すると以下のようになっています。
system.ping.pl:Pingのパケットロス率の監視
system.pimg.rta:PingのRTA値の監視
さらに実際に機器に適用してみるとこのようになります。
ここで注目してもらいたいのが機器に適用後のNameという列の情報です。
監視項目の横に✔がついているものがあります。
これがついている場合その監視項目は可用性に関する監視となります。
この✔がついている監視項目でアラートを検知しているのか、正常に監視が行えているのかという条件で機器のステータスは変化します。
可用性に関する監視の実用例
OpsRampでは監視設定をユーザー側でカスタマイズすることが可能です。
そのため本記事で説明している可用性に関する監視はユーザー側で定義することが可能です。
例として挙げた死活(ping)監視のパケットロス率の監視でアラートを検知した場合、これは機器が停止または応答を返せない状態にあるので非常にクリティカルな状態かと思います。
なのでデフォルトで可用性に関する監視の設定がされているのもうなずけます。
ただシステムによっては特定のサービス/プロセスが停止している時やDisk容量が枯渇している時、特定のイベントログが記録されたときなど重大な問題になる対象は様々です。
そんな時に監視設定をカスタマイズすることでただアラートを検知するだけでなく、特定の監視項目でアラートを検知した時に機器をDownステータスにしOpsRampに接続した時に視覚的に重大な問題が発生していることを伝えることができます。
機器のDown判定について
これまでの内容で可用性に関する監視のアラートが検知されたとき対象機器はDownステータスになることを記載していましたが、Downにさせるかの判定について可用性ルールがあります。
可用性ルールでは以下2つの条件をもって機器のステータスを変化させます。
1)全ての可用性に関する監視でアラートが発生していないとき機器をUpステータスに、それ以外の場合Downステータスにする(デフォルト設定)
2)何か1つでも可用性に関する監視でアラートが発生していなければ機器をUpステータスに、それ以外の場合Downステータスにする
機器Down時の通知
可用性に関する監視でアラートを検知し機器がDownステータスになった時、ユーザーは機器がDown状態になったことをOpsRampの画面上で見ることができます。
またサービスマップ機能を併用することでDown時にステータス変化に関するアラートを発報することができます(アラート発報を通知することもできます)。
▼サービスマップ機能について(OpsRamp公式ドキュメント)
https://docs.opsramp.com/platform-features/feature-guides/service-topology-maps/using-service-maps/
サービスマップではユーザーがマニュアルで機器構成をマップとして作成できます。
マップ作成時にはコンテナに機器を紐づけます。
各コンテナでは以下のように機器の可用性によってアラートを発報させる機能があります。
この機能を使用することで以下例のような通知を行うことが可能です。
コンテナ(サーバー):サーバーAのみ
通知設定:コンテナ内の1機器以上の可用性がDownした場合アラートを発報する
⇒サーバーAで可用性に関する監視でアラートを検知した場合、サーバーコンテナのDownアラートを発報できます
コンテナ(システム):サーバーA, サーバーB, スイッチC
通知設定:コンテナ内の2機器以上の可用性がDownした場合アラートを発報する
⇒コンテナ内の2機器以上で可用性に関する監視でアラートを検知した場合、システムコンテナのDownアラートを発報できます
以上
OpsRampでの可用性に関する監視設定の管理についての説明でした!