はじめに
みなさん、CloudWatch サービスは普段よく使われていると思います。
しかしながら、そもそもの機能の多さに加え、頻繁な機能強化(メニュー構成すら変更)、類似の機能もあることから、全てを把握するのはなかなか難しいのではないでしょうか?
私も結局どれを使えばよいの?と迷子になることが多々...
CloudWatch 機能のすべて
というわけで、どのような機能があるのかを整理してみました。
2024年1月時点の情報となります。re:Invent 2023で発表された、CloudWatch Appication Signals も網羅していますが、現在はプレビューのため、今後GAのタイミングでメニュー構成など変更になる可能性があります。
逆引き CloudWatch
ユースケース | 利用するサービス |
---|---|
ログコントロール | |
ログ出力を保存、集計、分析したい | Metrics Streams Subscription filters |
ログ出力を長期保存したい | Export data to S3 |
リアルタイムでログを確認したい | Live Tail |
ログをインタラクティブに検索したい | Logs Insights |
複数アカウントのログをまとめて管理したい | Cross Access Observability |
状態検知 | |
システムの状態をダッシュボードで一覧表示したい | Dashboard Metrics Explorer |
異常を通知したい | Alarm |
状態に応じて他のAWSサービスと連携したい | EventBridge(Event Buses) |
異常の予測検知をしたい | Anomaly Detection |
EC2のヘルスチェックをしたい | Resource Health |
オンプレマシンのヘルスチェックをしたい | Network Monitor |
Webアクセスによるエンドポイントの死活監視をしたい | Synthetics |
パフォーマンス分析 | |
各種メトリクスからパフォーマンスデータを詳細に分析したい | Container Insights Lambda Insights |
アプリケーションの性能ボトルネックを特定したい | X-Ray |
ユーザとAWSリソース間のトラフィックパフォーマンスをモニタリングしたい | Internet Monitor |
パフォーマンスに影響を及ぼす上位の要素を明らかにしたい | Contributor Insights |
EC2上で動作するアプリケーション(SAPなど)のモニタリングをしたい | Application Insights |
ユーザの動きをリアルタイムで収集してパフォーマンス向上をしたい | RUM(Real User Monitoring) |
システム全体のパフォーマンスを視覚化して分析したい | Service Map |
システムのService Level Objective(SLO)を測定したい | SLO |
その他 | |
機能をローンチするまえにテストをして問題を特定したい | Evidently |
まとめ
システムの動作状況を正しく把握し、システム運用においてデータに基づく意思決定するために必要な情報が取得できていることが重要です。
CloudWatchを活用することで、可用性、信頼性、レイテンシー観点の問題を検出、調査、修正し、SLAを維持することが可能となります。これからも進化をし続けるCloudWacthに注目していきたいと思います。