こんにちは、以前AWS-SAAを取るときは暗記で勝負したため、多くの機能の理解は実はあやふやでした。。。
八月上旬弊社BeeXに入ったらいろいろ勉強機会を下さって本当にありがたく思います!
自分のためでもありますが、ほかのAWS初心者にも役に立てたらと思って勉強メモをどんどん投稿したいと思います!!!
CloudWatchとは
・統合的な運用管理サービス
・AWSが提供するサービス(EC2やLambdaなど)だけじゃなく、外部サービスの監視(外形監視)もできる
・その下に、CloudWatch-logs、CloudWatch-Metrics、CloudWatch-Alarm、CloudWatch-eventがある
CloudWatch-logsとは
・ログの一元管理、検索。フィルタリングができる
・オンプレミスのサービスのログも取得できる
CloudWatch-ロググループとは
・ロググループで各ログを分けられる。
・タイムスタンプで文字列でログを出力する
・保存期間は1日~10年、または失効しない(無制限)で指定できる
CloudWatch-ログのインサイトとは
・英字の通り、「ログのインサイト」→「ログの中身」
・CloudWatch-logsをSQLみたいな言語でクエリし、必要な情報のみフィルタリングできる(全ログの中から目視で探すのは大変だたら。。。)
CloudWatch-Metricsとは
・特定の時期、特定のサービスを指定し、ヘルス情報やパフォーマンス情報、測定値を可視化・図視化する
・AWSの各サービスから自動取得するメトリクスがある(S3とか)
・オンプレミスのサービスのメトリクスも取得できる
CloudWatch-Alarmとは
・メトリクスを選択し、アラームを作成できる
・事前に閾値を設定することで(以上・以下・より大きい・より小さい)、異常が発生するときにアラームを出すサービス
・アラームをトリガーにインシデント対応ができる(SNSで通知とか、EC2を終了とか)
トリガーは三種類:ALARM(アラーム状態)、OK、INSUFFICIENT_DATA(データ不足)
アクションは三種類:Auto Scaling アクション、EC2 アクション、Systems Manager アクション
例:ある期間内に(1分間)、あるメトリクス(HTTPリクエストの回数)が、)閾値(平均100回)を超過したことが、実行ポイント(5回)に達した場合、アラームを出す
CloudWatch-Eventとは
・事前にイベントルールを設定することで、AWSリソースの状況を検知し、ルールにマッチングした場合(イベント発生)、アクションを実行する(lambda実行とか)
・スケジュール式(Rate式・Cron式)とイベント式(ルールにマッチしてイベント発火)がある
・AWS-EventBridgeとは上位互換、いまは基本CloudWatch-EventをクリックするとAWS-EventBridgeへ遷移するとなる(今後徐々にAWS-EventBridgeに移行するかな。。。)
CloudWatch-EventとCloudWatch-Alarm actionの違い
stackoverflowからの引用ですが、、、
Events can self-trigger based on a schedule; alarms don't do this.
Alarms invoke actions only for sustained changes.
Alarms watch a single metric and respond to changes in that metric; events can respond to actions (such as a lambda being created or some other change in your AWS environment).
Alarms can be added to CloudWatch dashboards, but events cannot.
Events are processed by targets, with many more options than the actions an alarm can trigger.
参照サイト