これは何?
社外でもオンプレでもクラウドな時代に必要かどうかはともかく、ハードウェアベンダーなどが提供してくれているRAID周りのオペレーションに使えるユーティリティと、ユースケースのメモです。
RAIDを構築することはほとんど無いので、障害時の現状確認関連ちょこっとだけやね。
よくあるケース
- ディスク故障を検知
- ユーティリティでRAIDを構成する物理ディスクの状態を確認⇨故障機器を特定
- 問題なければ壊れたディスクをオフラインにする
- 壊れたディスクのLEDを点灯させて、ディスク交換
- RAIDの仮想ディスクがRebuildされるのを眺める
- エラーが消えたら対応完了。
omreport (Dell)
RAIDの状態を確認する
RAID Levelとかを確認するのに便利。
$ omreport omreport storage vdisk
List of Virtual Disks in the System
Controller PERC 6/i Integrated (Embedded)
ID : 0
Status : Non-Critical
Name : Virtual Disk 0
State : Degraded
HotSpare Policy violated : Not Assigned
Progress : Not Applicable
Layout : RAID-10
Size : 272.25 GB (292326211584 bytes)
Device Name : /dev/sda
Bus Protocol : SAS
Media : HDD
Read Policy : No Read Ahead
Write Policy : Write Through
Cache Policy : Not Applicable
Stripe Element Size : 64 KB
Disk Cache Policy : Disabled
RAIDを構成するディスクの状態を確認する
何か検知した際はまずStateを確認するところから始める。
$ omreport storage adisk controller=0|grep State
State : Online
(snip)
State : Failed
$ omreport storage adisk controller=0
Controller PERC 6/i Integrated (Embedded)
ID : 0:0:X
Status : Ok
Name : Physical Disk 0:0:X
State : Online
Failure Predicted : No
Progress : Not Applicable
Bus Protocol : SAS
Media : HDD
Capacity : 136.13 GB (146163105792 bytes)
Used RAID Disk Space : 136.13 GB (146163105792 bytes)
Available RAID Disk Space : 0.00 GB (0 bytes)
Hot Spare : No
Vendor ID : DELL(tm)
Product ID : XXXXXXXXXX
Revision : XXXX
Serial No. : XXXXXXXXXXX
Negotiated Speed : Not Available
Capable Speed : Not Available
Manufacture Day : XX
Manufacture Week : XX
Manufacture Year : XX
SAS Address : XX
MegaCLI
こちらのBLOGにきれいにまとまっておりました。
http://d.hatena.ne.jp/mtkys+tech-memo/20121215/1355591665