2
1

More than 1 year has passed since last update.

【AWS】EC2において、AWS側のホスト問題に対処する方法

Posted at

はじめに

EC2において、AWS基盤側(仮想サーバーホスト、ハードウェア等)の問題が発生した際に、皆さんは対処してますか。
例え対処しなくても、AWS側が最終的には仮想サーバーホスト再振り分けをするみたいです。 ただ、サービスのダウンタイムを減らすためにも利用者側で先に対処するべきです。

今回のゴール

AWS基盤側の問題を検知し、利用者側で対処することです。
具体的には、あるCloudWatchのメトリクスをトリガー起点に、CloudWatchアラームのアクションを実行させることです。

作業手順

これから行う流れとしては、下記のとおりです。
「EC2構築」 → 「CloudWatchアラーム作成」 → 「確認」

入力あるいはクリック箇所は赤枠でできる限り示します。

EC2コンソールから、Launch instances選択
2022-10-27 20_14_48-Instances _ EC2 Management Console.jpg
Nameを入力
2022-10-27 20_18_09-EC2 Management Console.jpg
KeyPairは必要に応じて選択
2022-10-27 20_18_31-EC2 Management Console.jpg
Network設定も必要に応じて設定
2022-10-27 20_18_38-EC2 Management Console.jpg
後は、そのままデフォルトでLaunch instance選択
2022-10-27 20_18_41-EC2 Management Console.png
Pending
2022-10-27 20_18_57-EC2 Management Console.png
Running
2022-10-27 20_19_15-EC2 Management Console.png

ここまでがEC2構築です。次からは、CloudWatchアラーム作成方法です。
該当EC2選択 → Status checks選択 → Actions選択 → Create status check alarm選択
2022-10-27 20_19_34-EC2 Management Console.jpg
Alarm notificationはオフ(通知が必要な場合は設定おすすめ) → Alarm actionはオン → Recoverを選択
2022-10-27 20_20_01-Manage CloudWatch alarms _ EC2 Management Console.jpg
Alarm thresholds項目はStatus check failed:systemを選択
(上記のメトリクスがAWS基盤側の問題発生したもの)
2022-10-27 20_20_12-Manage CloudWatch alarms _ EC2 Management Console.jpg
Create選択
2022-10-27 20_20_27-Manage CloudWatch alarms _ EC2 Management Console.jpg
CloudWatchコンソールより、該当アラーム確認
2022-10-27 20_21_28-CloudWatch Management Console.jpg

ここまでがCloudWatchアラーム作成方法です。次からは、確認です。

下記コマンドで、該当アラーム状態を「ALARM」状態

2022-10-27 20_25_50-AWS CloudShell.jpg

aws cloudwatch set-alarm-state --alarm-name awsec2-i-0e341a4a47976b353-GreaterThanOrEqualToThreshold-StatusCheckFailed_System --state-value ALARM --state-reason TestforAWS

コマンド実行後
2022-10-27 20_25_56-AWS CloudShell.png
EC2コンソールより、該当EC2のAlarm statusがアラーム確認
2022-10-27 20_26_27-Instances _ EC2 Management Console.jpg
CloudWatchコンソールより、該当アラームを確認
(ALARM状態表示後、OK状態)
2022-10-27 20_49_42-CloudWatch Management Console.png
Historyを見ると、Type列にActionが実行されていることが確認
2022-10-27 20_50_06-CloudWatch Management Console.png

まとめ

EC2において、AWS基盤側の問題発生した際に対処する方法を示しました。まだ、対処していない方はぜひ検討してみてはいかがでしょうか。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1