【しくじり設計】NAS & クラウドバックアップ Amazon S3 vs box
最近台風、豪雨、猛暑にコロナと地球がやばいですね。
災害の話題が多くなるにつれて、中小企業様向けにBCP/DR対策のソリューションを提案することが非常に多くなってきました。
この度ローカルに設置してあるNASのデータのバックアップ先として、Amazon S3もしくはboxを使うパターンで、「しくじり設計」をしてしまったので懺悔および備忘録として記事にします。
バックアップ先としてのAmazon S3 とbox について、どういう使い分けをすればよいか皆さんの参考になれば幸いです。
ソリューション設計概要
・ローカルにNASを設置して、ファイルサーバとして利用する ※QNAP製NASを使ってます
・NASのバックアップアプリ(HBS3)を利用し、NAS内の指定フォルダのデータをクラウドストレージにコピーする
・NASから前回バックアップ時からのデータ差分を定期的にバックアップする ※初回はフルバックアップ
・クラウドストレージはAmazon S3(標準ストレージ = 0.025USD/GB) もしくはbox(Business Plan = 1ID/1,800円)を利用する
Amazon S3 とbox について
詳しくは公式Webサイト参照してください。
Amazon S3
box
どちらとも無制限に容量拡張可能なストレージサービスですが重要なポイントは以下です。
①料金体系のちがい
・Amazon S3 は使用するストレージ容量による「従量課金」
・boxは利用するユーザ数(ライセンス数)による「ID数課金」
②APIのアクセスレート制限のちがい
・Amazon S3は1バケットへのアップロードリクエストで3,500 リクエスト/秒
公式情報
・boxは1ユーザーあたりのファイルアップロードリクエストは40件/秒
公式情報
ケース
3拠点に設置してあるNASから合計12TB(4TB×3台)のデータのバックアップをする
- しくじりポイント
・APIアクセスレート制限を考慮せず、コストを安く出来るということだけで、boxを選択したこと
合計容量12TBのデータのバックアップ先としてAmazon S3とboxを比較検討したときに
【バックアップ目的で使い、一般ユーザはアクセスしないので管理者5人分のライセンスだけの購入でOK】、【ストレージはそこそこ大容量が必要】という条件のため、必要最低限の5ライセンス購入すれば、定額でストレージ容量無制限に利用できるboxを選択しました。
(費用のサンプル)
box → 1,800円 × 5ID = 9,000円/月
Amazon S3 → $0.025 × (1024GB×12) = $307.2/月
※$1=110円換算で約33,800円
たしかに同じ12TBのデータバックアップですがboxを使った方がかなり安くはなります。
- 発生した問題
・バックアップ処理が全然終わらない...
初回のフルバックは3日~5日かかり、差分バックアップでも1拠点あたり3時間ほどかかる...
原因は単純に*APIへのリクエストレート制限*です。
3拠点それぞれからbox APIへアップロードリクエストを送るのですが、リクエストできるレート制限に引っかかって全然データのバックアップ処理が進まないという事態に陥りました...
ちなみにQNAP NASではこんな感じでエラーログが表示されます。
[Hybrid Backup Sync] Backup job "バックアップジョブ名": Cloud storage service is unavailable or has exceeded its request threshold. Attempting to retry.
しかもこのエラーが1分おきぐらいに発生するので、ログが凄いことになります...
1拠点で1台のNASからのアクセスであれば、リクエスト数がレート制限を大幅に超えることはなかったかもしれませんが、3台から一気にリクエストがいってしまったので、制限かけられたということみたいです。
-
反省点
どのくらいAPIリクエストが発生するのかは、きちんと考慮しましょう!
バックアップであれば、データ容量だけでなく、データのオブジェクト数も考えましょう!
もしわからなければ無難にAmazon S3を選択することをおすすめします。
最後に
クラウドストレージを正しく使えば、コスパの良いBCP/DR対策が出来ます!
今回は私のようなへっぽこSEが残念な設計でboxを使ったことで、トラブルが勃発しましたが、box自体はかなり便利なサービスです。正しく仕様を理解し、BCP/DR対策を進めましょうd(‘・ω・’)