25
18

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

AWS EC2の新機能「ルートボリューム置き換え」で障害時のリストア対応を迅速化する

Last updated at Posted at 2021-04-23

はじめに

2021/4/23のAWSのアップデートで、実行中のEC2インスタンスのルートボリュームを置き換える機能が発表されました。
本記事では、この機能を使うことで、EC2で障害が発生した時のトラブル対応がどれだけ楽になるかを検証します。

ルートボリュームの置き換え機能とは

利用者はEC2インスタンスを停止せず、ルートボリュームのEBSを特定のSnapshotの状態に復元できます。

何が嬉しいのか

一見すると、嬉しさの分かりづらいアップデートですが、このアップデートの魅力は以下に尽きます。

障害時の復旧手順が簡単になり、対応速度が迅速化する

これまで、ルートボリュームを起因とした障害が発生した場合は、以下の手順で復旧をしていました。

  • EC2を停止
  • 予め取ってあったSnapshotからルートボリュームを復元 (新EBS)
  • EC2の管理画面で旧EBSを新EBSに置き換え
  • EC2を起動

上記が、今回のアップデートにより、以下の1ステップで良くなります。

  • EC2の管理画面でSnapshotを指定し、旧EBSを新EBSに置き換え

実際に見ていただくのが早いので、下記の検証で見てみましょう。

実際にやってみる (Linux編)

実際に操作してみます。
まずは、検証が楽であり、経過を追いやすい 「Cloud9」 のLinux EC2インスタンスで試してみます。

0. 事前確認

まずは、EC2が正常に稼働していることを確認します。
テスト用のファイルを作っておきます。
image.png

1. Snapshotを取る

ルートボリュームのEBS Snapshotを取ります。
image.png

image.png

2. EC2上でテストファイルを削除する

差分を確認するため、テストファイルを削除します。
image.png

3. ルートボリュームを置き換える

EC2のマネジメントコンソールで、各EC2の「ストレージ」の画面から操作します。
以下の画面で「ルートボリュームを置き換える」を押します。
image.png
次の画面で復元対象のスナップショットを選択します。
復元可能なスナップショットは、自動的に絞り込まれます。
スナップショットを選択したら「置き換えタスクを作成」を押します。
image.png
押すと、画面は遷移しませんが、上部にタスクが作成された旨が表示されました。
image.png
画面を戻って確認すると、置き換えタスクのステータスが表示されました。
image.png
Cloud9の画面に戻ってみると、接続が切れています。
image.png
この状態で1分ほど放置していたところ、再度接続されました。
先ほど削除したテストファイルは戻っており、期待通りの動作です。
image.png

以上のように、約2分ほどの通信断を経て、ルートボリュームをリストアできました。
通信断の時間は、条件によって前後する可能性がありますので、開発時はテストで確認しておくほうが良いです。

実際にやってみる (Windows編)

LinuxのEC2インスタンスに対する結果は想像しやすいですが、WindowsのEC2インスタンスでも同様に置き換えできるかを試してみます。

0. 事前準備

Linuxと同じく、EC2が正常に稼働していることを確認します。
テスト用のファイルを作っておきます。
image.png

1. Snapshotを取る

ルートボリュームのEBS Snapshotを取ります。
Linuxの時と同じ操作のため、画面は割愛します。

2. EC2上でテストファイルを削除する

差分を確認するため、テストファイルを削除します。
image.png

3. ルートボリュームを置き換える

先ほどと同じく置き換えます。
すると、置き換えタスクを作成して間もなく、RDP接続が切れました。

タスク一覧でしばらく待機していると、タスクが「保留中」から「完了」に変わりました。
image.png
RDP接続し直すと、先ほど削除したテストファイルは戻っており、Shutdown Event Trackerが起動していました。
image.png
ライセンス認証の状態も確認しましたが、問題なさそうです。
image.png

以上のように、約3分ほどの通信断を経て、ルートボリュームをリストアできました。
Linuxと同じく、通信断の時間は、条件によって前後する可能性がありますので、開発時はテストで確認しておくほうが良いです。

その他ポイント

  • 今回の機能を使った場合、EC2を停止しないため、作業の前後でPublic IPは変わりません。
  • インスタンスストアボリュームがルートボリュームの場合には置き換えることができません。
  • ベアメタルインスタンスのルートボリュームを置き換えることはできません。

まとめ

新たに登場した「ルートボリュームの置き換え」機能により、ルートボリュームを起因とした障害時の復旧作業のスピードを迅速化できます。
但し、作業中は通信断が発生するため、監視をしている場合は静観対応が必要となりますので、注意しましょう。

参考文献

25
18
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
25
18

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?