本記事について
プログラミング初心者がシステム運用の監視に関する知識を学んだので、その備忘録として載せております。
どうかお手柔らかにお願いいたしますm (- -)(_ _)ペコリ
監視システム
安定を保つことはサービスを運用する上で最も大切なことであり、人力ではミスも増え労力も増す。そこで自動的に運用しているサービスの監視を行い異常が検知された場合は運用担当者に通知するシステムのことを監視システムという。
サービスが正常に動くことの確認をする監視
「ユーザーへサービスを提供し続ける」とは、正常にサービスへアクセスが可能であり、かつ正常にサービスが利用できることである。
→定期的にチェックし問題があれば報告できるようにする。
→そのためにサービスが正常に利用できるかをチェックするWebシナリオ監視を行う
Webシナリオ監視
実際に運用しているサービス(Webサイト)にアクセスし、問題なく想定どおりの結果が得られるかを監視する手法。定期的に自動監視。
結合テストを本番環境において適用するイメージ
インフラ監視
アプリケーションを動かすサーバーなどのシステムを監視すること
システム間の繋がりをうまく行っているかを監視(システムは小さな連携で成立)
運用システムの裏側を監視し続けること
いつサービスが停止ししてもおかしくない状態を迅速に未然に予防するための監視。
発生した障害の「原因特定」のための監視
障害が発生したポイントだけではなくインフラのつながりも監視することで障害が発生した時も速やかに原因を特定し復旧までの道筋を立てれる。
→トラブル発生は広い視野で、多角的に原因分析を行い解決する。またその際にも新たなトラブルになるかもしれない箇所を見つけることがあるので、監視システムを確立することは重要