運用管理サービス
Amazon CloudWatch
AWS上で稼働する様々なシステムやAWSのリソースの情報を収集/監視/可視化するサービス
◉CloudWatchの動作イメージ
◉EC2のメトリクス
CloudWatchで取得/監視する項目のこと
◎標準メトリクス
AWSから提供されている標準の監視項目
メトリクス | 説明 |
---|---|
CPUUtilization | CPU使用率 |
DiskReadOps | インスタンスストアボリュームからの読み取り回数 |
DiskReadBytes | インスタンスストアボリュームから読み取られたバイト数 |
NetworkIn | 全てのネットワークインターフェイスから受信されたバイト数 |
◎カスタムメトリクス
- メモリ使用率
- ディスク使用率
- スワップ使用率
など
◉CloudWatchの監視間隔と保存期間
プラン | 課金 | 監視間隔 | 収集データの保存期間 |
---|---|---|---|
基本モニタリング | 無料 | 5分間隔 | 最大15ヶ月 |
詳細モニタリング | 追加料金が必要 | 1分間隔 | 最大15ヶ月 |
◉CloudWatchアラームによるアラームとアクション設定
メトリクスが**ある一定の値になった(閾値を超えた)**場合に、アラームとアクションを起動する
◎CloudWatchの状態
状態 | 説明 |
---|---|
OK | 定義された閾値を下回っている正常な状態 |
ALARM | 定義された閾値を上回っている異常な状態 |
INSUFFICIENT-DATA | CloudWatchに送信されるデータが不足しているため、正常か異常か判断できない状態 |
◉CloudWatch Eventによるイベント駆動型監視とアクション設定
イベントをトリガーにアクションを実行する
◎監視対象
- EC2インスタンスの状態変化(pending/running/terminatedなど)
- スケジュール(分/時/日間隔)
- Auto Scaling(起動成功/起動失敗など)
◎監視後のイベント
- Lambda関数
- SNS(Simple Notification Service)トピック
- Kinesisストリーム
- SQS(Simple Queue Service)キュー
その他の運用管理サービス
◉CloudWatch Logs
Cloud TrailやVPCフローログなど様々なAWSのログを統合的に収集するサービス
◉Cloud Trail
- AWSアカウントで利用された**操作(APIコール)**をログとして記録するサービス
- 不審なアクセスや操作がないか/意図しない設定変更がされていないか監視できる
◉VPCフローログ
VPC内のネットワークインターフェイス間で行き来する通信の内容をキャプチャする機能
◉AWS Config
AWSのサービスで管理されているリソースの構成変更を追跡するサービス
- EC2インスタンスの作成や削除などの構成変更
- S3バケットに対する構成変更
など
◉AWS Systems Manager
AWS内の様々なリソースの運用情報を統合的に可視化/制御するサービス
◎機能
- パラメーター機能
- オートメーション機能
- 実行コマンド機能
◉AWS Trusted Advisor
AWSのベストプラクティスに基づいて、ユーザーのAWS利用状況をチェックし、改善すべき事項を推奨するサービス
- コスト最適化
- セキュリティ
- 耐障害性
- パフォーマンス
- サービスの制限
◉AWS Backup
AWS内におけるデータのバックアップを一元化/自動化するサービス
- EBSボリューム/EC2インスタンス/RDSデータベースなどのバックアップの定期実行
- バックアップ状態の監視
参考