はじめに
re:Invent2022にて、Route53のApplication Recovery Controller(ARC)の新機能として「ゾーンシフト(zonal shift)」が発表されました(プレビュー)。AZ障害発生時に、ELBへのトラフィックを問題のあるAZからルーティングを回避させることが出来る優れものです。
※2023/1/11にGAとなりました!
Route53 Application Recovery Controllerとは
- Route53のARCは以下の3つの機能を提供
- 準備状況チェック
- リソースの準備状況を監視します
- ルーティング制御
- マルチリージョンアプリケーションのフェイルオーバーのためにトラフィックを再ルーティング
- ゾーンシフト
- マルチAZアプリケーションをAZの問題から回復
- 準備状況チェック
ゾーンシフトがサポートするリソース
Route53のARCは現在、NLBとALBのゾーンシフトをサポートしています。
※開始方法はELBかRoute53 ARCのいずれかのコンソール上で可能
Route53 ARCの場合
ELBの場合
Route53 ARCでゾーンシフトとリソースを操作するため条件
- ゾーンシフトは、クロスゾーン負荷分散ではサポートされない
- AWS Global AcceleratorのアクセラレータのエンドポイントであるALBではサポートされない
- ALBがNLBのターゲットである場合、NLBからゾーンシフトを開始する必要あり
- ゾーンシフトは、AWSサービスによってRoute53 ARCに登録されたマネージドリソースである必要あり
- リソースとゾーンシフトは開始するAZ或いはリージョンにデプロイする必要あり
- リソースでゾーンシフトを使用するためのIAMアクセス許可が必要あり
ゾーンシフトの有効期限
全てのゾーンシフトは開始時に有効期限(最大3日)を設定する必要があります。ゾーンシフトを更新する事で新たな有効期限を設定可能です。
- 設定範囲として以下が用意されていました。
- 6時間
- 12時間
- 1日
- 3日
- カスタム(1分~3日)
ゾーンシフトのベストプラクティス
- キャパシティプランニングと事前スケーリング
- ゾーンシフトによって特定AZへのトラフィックのルーティングを回避させた場合に、ターゲットであるインスタンス或いはコンテナリソースがリクエストを処理する為に、事前にリソースに余裕を持たせる。
- 事前にゾーンシフトを開始するテスト
- AZからトラフィックが移動することを定期的にテストする
- 全てのAZが正常にトラフィックを処理していることを確認
- 平常時にロードバランサーのターゲットが正常であり、リージョン内のAZでトラフィックをアクティブに処理していることを確認
- DRにデータプレーンAPI操作を使用
- 高速で信頼性の高い復旧が重要な場合は、データプレーン操作の方が適している為、AWS CLIかAPIを推奨。
- 一時的にのみゾーンシフトを使用してトラフィックを移動
- 問題を修正するための措置を講じたらすぐに、アプリケーションのリソースを復元する
CLIによるゾーンシフト操作
参照
オプション | 概要 |
---|---|
--away-from | トラフィックがリソースから移動されるAZのID 東京リージョンの場合は、apne1-az4、apne1-az1、apne1-az2 |
--comment | コメント |
--expires-in | 有効期限 |
--resource-identifier | ゾーンシフトに含めるリソースの識別子で、リソースのARN |
マッピング確認
※ゾーンIDとAZ名はアカウントによってマッピングが異なります。自身の環境でどのゾーンIDでゾーンシフトを開始するべきかを確認するには、以下コマンドを実行してください。
aws ec2 describe-availability-zones \
--region ap-northeast-1 \
--query 'AvailabilityZones[].{RegionName:RegionName, ZoneName:ZoneName, ZoneId:ZoneId}' \
--output table
マッピングコマンド結果例
----------------------------------------------------
| DescribeAvailabilityZones |
+----------------+-------------+-------------------+
| RegionName | ZoneId | ZoneName |
+----------------+-------------+-------------------+
| ap-northeast-1| apne1-az4 | ap-northeast-1a |
| ap-northeast-1| apne1-az1 | ap-northeast-1c |
| ap-northeast-1| apne1-az2 | ap-northeast-1d |
+----------------+-------------+-------------------+
ゾーンシフト開始
リソース:nlb
対象ゾーン:apne1-az1
有効期限:5分
$aws arc-zonal-shift start-zonal-shift \
--resource-identifier="arn:aws:elasticloadbalancing:ap-northeast-1:xxxxxxxxxxxx:loadbalancer/net/xxxxx/xxxxxxxxxxxx" \
--away-from="apne1-az1" \
--expires-in="5m" \
--comment="Shifting traffic away from apne1-az1"
コマンド結果
{
"awayFrom": "apne1-az1",
"comment": "Shifting traffic away from apne1-az1",
"expiryTime": "2023-01-03T16:41:34+00:00",
"resourceIdentifier": "arn:aws:elasticloadbalancing:ap-northeast-1:xxxxxxxxxxxx:loadbalancer/net/xxxxxx/xxxxxxxxxxxx",
"startTime": "2023-01-03T16:36:34+00:00",
"status": "ACTIVE",
"zonalShiftId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxx"
}
コンソールで確認
sample-nlbをリソースとしてゾーンシフトがapne1-az1(ap-northeast-1c)を対象に開始しているのが分かりますね。時間が経過した関係で残り4分となっている事も確認できました。※時間が5分経過するとコンソールから自動で削除されました。
さいごに
今回はRoute53 ARCの新機能ゾーンシフトについて調査しました。AZ障害発生時に素早く簡単に問題AZへのルーティングを回避させてアプリケーションを守る事ができるので覚えておいて損はないかと思います。GA後に余裕があったらベストプラクティスにあるように実際にテストして備えておくと、いざという時落ち着いて対処出来る様になるので是非取り入れていきたいですね。
参照