AWS Skill Builder における下記コンテンツの学習記録(ポイントとメモ)です
AWS Cloud Practitioner Essentials (Japanese) (日本語実写版)
モジュール7:モニタリング
システムの運用、監視に利用するサービスの章
Amazon CloudWatch
メトリクスとは、測定や基準、指標値になる数字や情報のこと
AWS リソースのシステムパフォーマンス(CPU 使用率、ストレージの空き容量や IOPS、ネットワークトラフィック流量など)を可視化する
Amazon CloudWatch
AWS リソースのメトリクスを一元的に管理でき、メトリクスのデータに基づいたアラームアクションを設定できるサービス
CloudWatch アラーム
メトリクスの値がしきい値を跨いだ時に、自動的に何らかのアクションを実行するアラームを作成できる
不要になった EC2 インスタンスが実行され続けてしまい無駄な料金が発生したりしないよう、CPU 使用率が一定時間しきい値を下回った場合に EC2 インスタンスを自動停止させたり、アラームの発生を Amazon SNS を通してEメールで通知してくれるようにできる
CloudWatch ダッシュボード
CloudWatch でメトリクスを一元的に管理するために利用できる、ダッシュボード機能
各リソースのパフォーマンス状態をカスタマイズしながら表示させることができる
AWS CloudTrail
監査、セキュリティモニタリング、運用上のトラブルシューティングを可能にするサービス
アカウントに対するアクティビティ、API コールを記録し、S3 バケットに安全に保管する
モジュール3の学習で出てきたように、AWS ではすべてに API コールを利用する。これらAPI コールをログとして保存でき、ログファイル自体の整合性も検証可能な状態とされ、監査証跡として利用できるよう設計されている
CloudTrail イベント
CloudTrail ではイベント履歴として、APIコールイベントにおいて以下のような情報を保存している
- 何がおこったのか:新しい IAM ユーザ XXX の作成
- 誰がリクエストを行ったのか:IAM ユーザ YYY
- いつ起こったのか:2023年10月13日 12:00
- どのようにリクエストが行われたのか:AWS マネジメントコンソールによるアクセス
CloudTrail Insights
CloudTrail Insights では AWS ユーザーが発生させた API コールや API エラー率などを継続的に分析することで、異常な(通常と異なる)アクティビティを特定することができる
AWS Trusted Advisor
AWS 環境を検査して、ベストプラクティスに基づくレコメンデーションを提供するサポートサービス
5つのカテゴリ(後述)における調査結果をベストプラクティスと比較し、推奨されるアクションと追加リソースのリストを提供する
#サポートプランによってアクセスできるチェックに差がある
AWS Trusted Advisor ダッシュボード
Trusted Advisor のダッシュボードでは、各カテゴリのチェック項目を確認できる
- コスト最適化
- 例:アイドル状態の RDS インスタンス、Lambda 関数の過剰なタイムアウト
- パフォーマンス
- 例:EBS スループット・レイテンシーの分析、EC2 インスタンスの使用量
- セキュリティ
- 例:セキュリティグループのアクセスリスク、不要な S3 バケットのアクセス許可
- 耐障害性
- 例:Auto Scaling グループ、無効化されたアベイラビリティゾーンや RDS バックアップ
- サービス制限(クォータ)
- アカウントに作成できるリソース最大数。クォータの80%に達すると通知される
この章は10~15分程度で短いですね