そもそもDRとは?
disaster recovery の略で、災害からの復旧の意味です。
天災や不正侵入によってシステムが壊滅的な状態になった際の復旧・修復や
それに備えてのシステム・体制のことを指します。
AWSのDR対策のパターン
AWSのDR対策として4パターンが公式ドキュメントにもあったので
それについて詳細に確認してみました
パターンとして以下4つになります。
- バックアップ・リストア
- パイロットライト
- ウォームスタンバイ
- マルチサイト
バックアップ・リストア
- 概要
定期的にシステムのバックアップを作成、
障害発生時はバックアップからの復旧を行います。
イメージ図は以下です
- 復旧時間
時間単位での復旧時間を見込む必要があります。
- 復旧時点
最終バックアップ時点まで
- 費用
データだけの保存なのでコストは安い
パイロットライト
- 概要
DR用にDBを起動しておいて、通常はデータの同期のみ。
障害発生時のみ別リージョンでアプリケーションを立ち上げてDR用のDBを使用します。
- 復旧時間
数十分単位での復旧時間が見込まれます
- 復旧時点
最終データの同期時点まで
- 費用
DBを別で稼働しておく必要があるのでバックアップ・リストアよりはかかります。
ウォームスタンバイ
- 概要
DR用のリージョンで縮小した構成のシステムを常時稼働しておきます。
障害発生時にはDNSを切り替えて稼働を行います。
- 復旧時間
Route53を切り替えるため
数分単位での復旧時間が見込まれます。
- 復旧時点
最終データ同期時点まで
- 費用
アプリケーションやDBなど、別リージョンで縮小した構成を常に運用しないといけないので
パイロットライトより費用はかかります。
マルチサイト
- 概要
DR用のリージョンで同様の構成のシステムを常時稼働しておきます。
障害発生時にはDNSが自動フェイルオーバーでをDR用の環境に切り替わって稼働を行います。
- 復旧時間
DNSの自動フェイルオーバーなので数秒単位での復旧時間が見込まれます。
- 復旧時点
最終データ同期時点まで
- 費用
アプリケーションやDBなど、別リージョンで同様の構成を常に運用しないといけないので
ウォームスタンバイより費用はかかります。
まとめ
復旧時間と費用は反比例することがわかりました
- | 復旧時間 | 費用 |
---|---|---|
バックアップ・リストア | 数時間単位 | 低 |
パイロットライト | 数十分単位 | 中 |
ウォームスタンバイ | 数分単位 | 中・高 |
マルチサイト | 数秒単位 | 高 |
勉強後イメージ
言葉とかは知ってたけど、ちゃんと調べたことはなかった
特にパイロットライトとか初めて知った。
手間・お金と復旧時間は反比例するからどこまでするかは考えないといけないですね。