Azureにて提供されている各種アラートがどのような場面で利用できるのか簡単にまとめた。
また、アラート通知を導入するのに参考となる公式ドキュメントも併せて記載した。
参照先のリンクはすべてAzure の公式ドキュメントとなる。
ログアラート
概要
大まかに2つの用途で利用できる。
- ログとして出力されるファイルを参照し、ユーザが設定した条件にマッチした場合、アラートが発報される。
データソースの例はWindows イベント ログ 、syslog、アプリケーション例外など - 仮想マシンのゲストオペレーティングシステムからデータを検出し、ユーザが設定した条件にマッチした場合、アラートが発報される。
データの例はCPU使用率やディスク領域など
各項目とも、収集するにはエージェントの導入など設定が必要な場合がある。
データソースの詳細やエージェント要否については参考ドキュメントより確認すること。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
- Azure Monitor で使用する監視データのソース
- データ収集ルール_(監視データのソース対象がオペレーティングシステムの場合)
- Azure Monitor のドキュメント
- Azure Monitor の概要
メトリックアラート
概要
デフォルトのしきい値、または任意のしきい値を設定し、しきい値を超過した場合、アラートが発報される。
しきい値=メトリックデータ(数値)となる。
メトリックは一定の期間で収集されている。
しきい値は静的、動的ともに設定可能。
条件を複数設定し、すべての条件が適用された場合のみアラート発報することも可能。
(例)CPU使用率が90%以上かつメモリ使用率が90%以上の場合、アラートを発報するなど。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
- Azure Monitor のメトリック アラートでサポートされるリソース
- Azure Monitor のメトリック アラートについてよく寄せられる質問
- Azure Monitor のドキュメント
- Azure Monitor の概要
アクティビティログアラート
概要
アクティビティログには、リソースで発生したアクション(特定の操作)の監査が提供される。
リソースに対して特定のイベントが発生したときにアラートが発報される。
(例)特定のイベントに関する例は再起動、シャットダウン、リソースの作成や削除など。
再起動がユーザによって手動で行われた際、アラートを発報する。
Azureサブスクリプションのリソースに対して行われるすべての書き込み操作 (PUT、POST、DELETE) について、"何を"、"誰が"、"いつ" 行ったのかを確認できる。
Azure テナントのサインイン アクティビティの履歴と、特定のテナントに対して Azure AD で行われた変更の監査証跡はAzure Active Directory (Azure AD) ログとなり、
アクティビティログは対象範囲外となる。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
Resource Health アラート
概要
リソース正常性では、リソースが監視されており、常に動作している状態かどうかが分かる。
(例)この仮想マシンをホストするサーバーは稼働しているか、
ホストとストレージ アカウント間のネットワーク接続が存在するかなど
Azure のリソースに影響を及ぼしているサービスの問題を診断したり、
リソースへのトラブルシューティングを実施することも可能となる。
また、SLA 違反が発生したかどうかにも確認できる材料となる。
対象となるリソースの一覧と確認される項目は参考ドキュメントを確認すること。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
Service Health アラート
概要
Azureサービスとリージョンが対象となり、計画メンテナンス作業やAzure側の障害によりステータスの変化があった場合、アラートが発報される。
(例)Microsoft側でWANの設定変更を実施したが、作業ミスによりMicrosoft 365やPower Platformなどのサービスにアクセスできなくなる障害が発生、アラートが発報されるなど
対象となるサービスの一覧は参考ドキュメントを確認すること。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
スマート検出アラート
概要
Application Insights リソースでのスマート検出により、
Web アプリケーションの潜在的なパフォーマンスの問題や失敗の異常に関する警告を受け取れる。
Application Insights を設定した後、アプリで特定の最少限のデータが生成されると、スマート検出では 24 時間かけてアプリの通常の動作を学習する。
通常の動作より外れた際、異常を検出する。
アラート通知設定
通知設定は下記のドキュメントを参照すること。
参考ドキュメント
Prometheus アラート
概要
Prometheus アラートは、Kubernetes クラスター (AKS を含む) のパフォーマンスと正常性に関してアラートを発報する。
アラート通知設定
通知設定は下記のドキュメントを参照すること。