はじめに
流行のクラウドストレージをバックアップ先に利用してみたい
今回は、クラウドストレージをどれぐらい無駄なく、企業のデータ保管先に使うことができそうか、というお話です。
総務省の動向調査 (*1) の結果にもありましたが、クラウドストレージ(オブジェクトストレージを含む)にバックアップデータを保管するケースは、安価で高可用性・使い勝手の良さから、今後も増加傾向にあるようですね。
(*1) 令和元年通信利用動向調査の結果
https://www.soumu.go.jp/menu_news/s-news/01tsushin02_02000148.html
一方で、企業がビジネスで利用する ITサービスの情報は、豊富でリッチになっています。 「量」「サイズ」ともに肥大化し、運用で維持しなければならないデータ量は予想を上回る勢いで増えていませんか!?
※「ウチはクラウドに移行したから大丈夫かな・・」という方も、クラウドに行っても自分のデータは自分で守らないといけないのでご注意ください
有事(故障・災害・セキュリティ被害・人災など)の復旧目的や長期保管用としても、爆発的に増え続ける非構造化データを維持管理することは避けられません。 安価なクラウドストレージを利用した場合でも、数十TB ~ 数PB クラスを保有する企業レベルのデータ量となるとどうでしょうか。 それでもかなりのコスト負担になりそうですね。 今現在だと、標準タイプで 1TB のデータを 5年間保管したら 10万円切るのはさすがに厳しいでしょうか・・
NetBackupのクラウドストレージ対応
Veritas NetBackup では、2010年のバージョン 7.0からデータ保管先としてクラウド/オブジェクトストレージをサポートしてきました。 その後、永久増分バックアップを実現する技術として登場したアクセラレータ(Accelerator)も保管先としてクラウドストレージをサポートしました。
更に世の中の様々なクラウドストレージやオブジェクトストレージを広くサポートし続けながら、バージョン 8.1 では仮想的に重複排除ストレージのように扱える技術 CloudCatalyst が登場しました。 これにより、クラウド/オブジェクトストレージの消費は飛躍的に改善されて、バックアップやリストアの時間も短縮できるようになりましたね。
What is CloudCatalyst に関しては、過去のQiita投稿 ↓ をご参考ください。
NetBackup CloudCatalyst for AWS入門 まとめ
NetBackup CloudCatalyst for AWS入門 その1
NetBackup CloudCatalyst for AWS入門 その2
NetBackup CloudCatalyst for AWS入門 その3
時短ワザ!保存データ量を最小にしてIBM Cloud Object Storageへバックアップデータを保管してみよう
このように NetBackup でもクラウドストレージへのデータ保管には幾つか選択肢がありますが、重複排除しながらクラウドストレージが使える技術がどのくらい効果があるのか、非常に興味があるポイントではないでしょうか。
そこで今回はそれぞれのバックアップ方法を試して、クラウド上のストレージ消費量にどのぐらい差が出るのかを実測してみました。 合わせて、オンプレにあるNetBackupオリジナルの重複排除ディスク上のサイズとも比較してみました。
ストレージ消費量を比較する各バックアップ内容は?
データをバックアップして保管するまでの方法ですが、今回は5つのケースで実測しています。
(1) NetBackupメディアサーバのディスクに重複排除機能(MSDP)で保管します(Windows使用)
(2) NetBackupメディアサーバのディスクに重複排除機能(MSDP)で保管します(Linux使用)
(3) バックアップデータを直接 S3ストレージに保管します(メディアサーバからの複製でも同等)
(4) バックアップデータを直接 S3ストレージに保管しますが、オプションに Acceleratorを指定して永久増分バックアップ方式を使用します
(5) CloudCatalyst を使います。 メディアサーバから CloudCatalyst へ複製、もしくは CloudCatalyst に直接バックアップどちらでもOK
バックアップ対象のデータですが、毎回新しいデータを追加して、世代毎にフルバックアップし、4世代分保管します。 バックアップ対象は3台用意しましたが、グローバル重複排除が本当に効くのかも確認したかったので、今回はどのバックアップ対象にも同じデータを置くことにしました。
図2. 初期世代 ~ 最新世代まで、4世代分のデータを順次フルバックアップ
バックアップ対象のデータは、筆者のパソコンにある普通のオフィス系ファイルやPDFファイル、ZIPファイル、画像や動画ファイルなど使いました。 最近のファイルはかなり最適化されているので、ファイル単体の重複排除効果はあまり期待できないかもしれませんが、リアリティのあるデータにしてみました。
このような方法で実測しますが、結果は下記のように整理することにします。
表2. 検証結果のまとめ方
さてどんな結果になるんでしょうか・・
予想と実測結果
重複排除機能はクラウドストレージにも効くのか?
予想
実は、検証前こんな予想(期待)をしてました。
- (1)と(2) は、プラットフォームが違うけど結果はほぼ同じだろう
- (1)と(2) は、そこそこ重複排除は効くはずなので、元のデータよりは減るだろう
- (1)と(2) は、3台に同じデータがあるので、3台総合計の1/3以下にはなるだろう
- (3)は、毎回バックアップ対象の合計分だけクラウドストレージを消費するだろう
- (3)は、3台分別々にクラウドストレージを消費するだろう
- (4)は、毎回バックアップ対象の追加分だけクラウドストレージを消費するだろう
- (4)は、3台分別々にクラウドストレージを消費するだろう
- (5) CloudCatalyst は、(1)と(2)とほぼ変わらない結果になることを期待!
実測結果
結果はどうなったでしょうか・・ その実測値は次の通りでした!
おぉ!! CloudCatalystの重複排除効果ですが、期待を裏切らない結果になったようですね。
もう少し判りやすくグラフにしてみましょう。
グラフ1. データ保管方法別:バックアップ世代毎のストレージ消費増加傾向
(1) (2) (5) の方法でバックアップすれば、グローバル重複排除が効いて必要最小限のディスク領域しか使わないと言えます。 毎回、フルイメージをそのままクラウドストレージに置いていると、あっという間に 10倍ぐらい違う使用量になってしまうんですね。
企業クラスのデータを保護するとなるとバカにならないコストになりそうです。 ここまで違いが出ると、安易にクラウドに同じようなデータをたくさん置いておくのも考え直した方がいいかもしれないと思ってしまいますね。
まとめ
期待を裏切らない結果となりましたが、最後にまとめてみます。
・クラウドストレージも安いからと言って安易に使うと、予想以上に費用がかかるかもしれない
・何世代分も長期間、大量に保存する必要がある企業にとって、重複排除技術の利用は非常に重要
・クラウドストレージをあたかも重複排除ディスクのように見立てる CloudCatalyst は非常に有用
・クラウドストレージと重複排除の組み合わせは、Tape運用と比べて大きなアドバンテージになる
ということで、一般のバックアップソフトやコピーベースの方法でクラウドストレージにそのままバックアップしている状況であれば、一度見直してみる価値はありそうですね ☺
最後に、2020年7月末に提供開始された NetBackup 最新バージョン 8.3 では、独自の重複排除機能(MSDP)とクラウドストレージを共有化させるような技術 MSDP cloud が登場しました。 ストレージ消費についても CloudCatalystと同等の削減効果が期待できますが、この新機能の嬉しい点は、CloudCatalystの専用サーバを構築しなくても済むようになったことです。
詳しくは今後の投稿にてご紹介します。
いかがでしたでしょうか。 NetBackupの重複排除技術は、クラウドストレージにも広がりましたし、NFS/CIFSのファイル共有サービスにも利用できるようになっていて、常に進化し続けていますね。 この先もさらに便利になることを期待しています。
商談のご相談はこちら
本稿からのお問合せをご記入の際には「コメント/通信欄」に#GWCのタグを必ずご記入ください。
ご記入いただきました内容はベリタスのプライバシーポリシーに従って管理されます。
その他のリンク
【まとめ記事】ベリタステクノロジーズ 全記事へのリンク集もよろしくお願い致します!
ありがとうございました。