【SAS対策】AWSの障害復旧（Disaster Recovery: DR）戦略

Posted at 2025-10-25

AWSにおける障害復旧（Disaster Recovery: DR）とは

用語	説明	例
RTO（Recovery Time Objective）	システムをどれだけ早く復旧させるか（＝許容できるダウンタイム）	1時間以内に復旧
RPO（Recovery Point Objective）	どこまでのデータ損失を許容できるか（＝バックアップの間隔）	15分前までのデータを保持

AWSでは、コストと復旧速度のバランスに応じて4つのレベルのDR戦略が定義されています。

戦略	概要	コスト	復旧速度（RTO）
① バックアップ＆リストア	データを定期的にバックアップして、災害時に新環境へ復元	低	数時間〜数日
② パイロットライト	最小限の構成を常に稼働させ、災害時に必要リソースを起動して拡張	中	数十分〜数時間
③ ウォームスタンバイ	本番と同等の環境を縮小スケールで常時稼働、災害時にスケールアップ	高	数分〜数十分
④ マルチサイト（アクティブ-アクティブ）	複数リージョンに本番環境を完全複製して同時稼働	非常に高	秒〜分

最も基本的なDR戦略
平常時はコストを最小限にし、S3やGlacierにバックアップを保存しておき、障害発生時に新たな環境を立ち上げて復旧

本番システムの最小限の重要部分（例：DBやコアアプリ）だけを常時稼働させておき、
災害時に周辺サービス（Webサーバー、ロードバランサーなど）を起動して拡張

本番と同様の環境を縮小スケールで常時稼働させ、障害発生時にスケールアップして即時切替可能な状態

複数リージョンで本番環境を同時稼働させ、トラフィックを分散
障害発生時はDNSルーティング（Route53）やGlobal Acceleratorで自動的に切り替え

ケース	方向性
「コストを最小化しつつ、DRを実現したい」	バックアップ＆リストア or パイロットライト
「最小限の構成を常時稼働、障害時にスケールアップ」	パイロットライト
「別リージョンに小規模環境を常時稼働」	ウォームスタンバイ
「完全なアクティブ-アクティブ」	マルチサイト
「RTO/RPOを最も短くしたい」	マルチサイト
「Vault LockやS3クロスリージョンでデータ保護」	バックアップ＆リストアの一部