ほんとにしょうもないミスではあるんですが、ちゃんと確認しないと誰にでも起こりうるということで、自戒の念と共にアウトプットします。
そもそもRAIDってなに
RAID(Redundant Arrays of Inexpensive Disks、レイド)とは、複数のHDDをひとつのドライブのように認識・表示させる技術です。万が一のHDD故障時にもデータ復旧・アクセスを可能にする安全性の向上や、複数HDDへの分散書き込みによるデータ保存の高速化など、RAIDモード毎に特長があり、用途に合わせて様々なストレージ構築が可能です。(バッファロー社記事 https://www.buffalo.jp/topics/knowledge/detail/raid-about.html より引用)
例えば4TBのHDDが4枚あれば、RAIDを用いて「これは16TBのHDDだ」と認識させられるということです。
RAIDには種類がある
単にRAIDといっても、書き込み速度や容量等、種類によってさまざまな特徴があります。
例えばRAID0は、利用可能容量がHDDの容量×本数(4TBのHDDが4本なら16TB)ですが、HDDのどれか1本が故障してしまうとデータを復旧できません。
一方RAID6は、同じHDDの容量・本数で比較すると、利用可能容量はRAID0の半分になるものの、HDD2本の故障までならデータを復旧させることができます。
ユーザーは、RAIDが持つそれぞれの特徴や利点を考慮し、実際に構成していくことになります。
今回ミスったのはRAID5
RAID5はHDD(もしくはSSD)3本以上で構成できます。
利用可能容量は、HDDの容量× (N-1) です(Nは3以上)。
今回の場合はとある企業のデータバックアップに合計16TB必要(と後で分かった)で、リプレイス案件でもあったため、NASの選定などはお任せしてしまっていました。
作業日にお客さんから、「このNAS(4TBのHDD×4本内蔵)をRAID5で構成してリプレイスお願いします」と言われたのでその通り実装したんですが、後日、バックアップの容量が溜まっていった時に足りなくなった(12TBしか使えないから)というわけです。
まとめ
新規設置ならともかく、リプレイス案件であればもともとのNASで使われている容量は大まかに把握できます。
いくらビジネス的に信頼関係があるお客様からの指示であろうと、鵜呑みにせずまずは確認するようにすべきでしたね。
容量の合計を知らされてなかったからそれで足りるもんだと思ってたと言い訳させてください。
ちなみにリプレイス前のNASは4TBHDD×8本でRAID6組んでたっぽい。マジか~....