RTOとは
RTO(Recovery Time Objective)とは、障害発生時「どのくらいの時間で(いつまでに)」 復旧させるかを定めた目標値である。
言い換えると、RTOは「システム停止やサービス中断が許される時間」とも言える。
RDSの高頻度バックアップについて
- 普通のバックアップ(普通の頻度): 1日一回の頻度、1週間では最低でも二日間以上を選択する必要がある
- 高頻度バックアップ: バックアップの頻度をもっと短くできて、最短15分一回バックアップできる。
高頻度バックアップはなぜかRTOが短縮できるのか
障害発生する時に、復旧するには以下の2つのステップが必要です。
- バックアップされていたデータ(物理バックアップでもいいし、スナップショットでもよい)から新しいインスタンスを起動する
- 前回のバックアップ時点からコミットされていたトランザクションに伴って生成されていたbinlogを取得し、binlog中のクエリを順次実行する(当たり前ですが、内容が多ければ時間もかかる)
- 障害発生する時には以下に上記の2の時間を短縮するのかはRTO短縮のポイントになります。
- 高頻度バックアップ利用する場合は、最短15分一回バックアップ取得できて、そこから長くても15分間のbinlogしかなくて、binlogの中のクエリ量も少なくて、2の時間が短縮できる。
- 結果として障害発生後の復旧のRTOが短縮できることになります。