0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

RAID構成におけるパリティディスク利用方法の最適解

Posted at

エンタープライズ向けにストレージ製品を提案する際、どんなタイプのドライブを選んでいただいたとしても基本的にはドライブを複数本買っていただいて、RAID構成による冗長化と性能向上を果たした形で実際に運用をしてもらっている。

今回の投稿では専用ストレージ機器を使用するユーザさんがよく使用されるRAID構成と全く使用しないRAID構成の両方について記述していきたい。そして利用目的ごとの最適解は何なのか、についても自分なりの考えについても触れたい。

目次

  • RAID技術におけるパリティとは
  • パリティディスクを用いるRAIDタイプ
  • パリティ専用型方式とパリティ分散型方式の違い
  • 最終的な性能比較

RAID技術におけるパリティとは

まずはパリティという用語について。データの冗長性と信頼性を向上させるために利用される技術である。
このパリティはとっかかりとしてミラーリング(コピー)とまずは比較されるものかもしれない。

実効容量8TBを冗長化させたい。その場合のミラーリング(RAID1)構成ではHDD SATAディスク8TB×2本となる。シンプルな反面、冗長性に必要な容量を食べすぎているきらいがある。

パリティを使ったRAID構成では、ミラーリングと比較して冗長化に使う容量を少なくできる。ミラーリング(RAID1)のデータ領域と冗長化領域が1:1だとすると、パリティはデータ領域と冗長化領域は3:1くらいの比率で構成することも可能だ。

パリティディスクを用いるRAIDタイプ

  • RAID3:パリティ情報を専用のパリティディスクに保存する。並行稼働による全ディスクにわたるデータの完全ストライプ方式のため大きなデータ転送に適している。その反面、小さなデータ転送には不向き。
  • RAID4:RAID3同様にパリティ情報を専用のパリティディスクに保存する。ただデータディスクには個別にアクセスできるため、読み書きのスループットは高い。パリティ専用ディスクに書き込みが集中するリスクがある。
  • RAID5:パリティ情報を各ディスクに分散して保存する。パリティへの書き込み集中が発生しないためパフォーマンスが上がる。ランダムI/Oに強みが活かせるためRDBMSなどのデータベース関連でよく使われる。
  • RAID6:RAID5からパリティ情報を2本のディスクに分散して保存する。そのため複数のディスクが同時に故障しても復元が可能となる。ただ書き込みのたびにパリティ構成の調整が走るので、1回のI/Oにかかる負荷は大きい。

現在、エンタープライズ向けシステム用に専用ストレージを使っているユーザさんは基本的にRAID5、RAID6で運用をしている。
専用ストレージではなく、例えばサーバ機器内のディスクを保存領域として使っている際はミラーリング(RAID1)を使うユーザさんもいる。
パリティを使った構成でRAID3、RAID4を使っているユーザさんは、個人的な業務の範囲だとまだ目にしていない。

パリティ専用型方式とパリティ分散型方式の違い

あくまで私個人の業務範囲の話であるが、なぜこれほどまでにパリティ専用型(RAID3)とパリティ分散型(RAID5)で利用比率に差が出てしまったのか。

より詳細に両者の違いに着目しながら考察していきたい。

パリティ専用型はパリティディスク以外のディスクでまるごとデータの保存領域として使われているので、データだけの抽出はシンプルで速い。そして何より連続データの大容量転送にかなり強みを持っている。

そのためやはりシーケンシャルI/Oで強みを発揮するような使い方では優れたパフォーマンスが期待できる。
その一方でパリティ専用ディスクが故障してしまった場合、全てのデータ消失と隣り合わせである。

パリティ分散型は全てのディスクにデータとパリティが混在して保存されているため全データ消失のリスクは限りなく低い。そして読み取り性能もそこまで悪くない構成でもある。安全性とパフォーマンスのバランスが良いのだ。

デメリットを挙げるとしたら書き込みの度にパリティ計算が発生するため上書き更新が頻繁なシステムだとパフォーマンスが低下する恐れはある。ディスク故障時のデータ再構築に時間がかかりがちである。

どちらの方式もメリット・デメリットは存在するが、汎用的に利用したいのであればパリティ分散型のメリットの方が魅力的である。

最終的な性能比較

RAID 読み取り性能 書き込み性能 データ保護
3 ランダム読み取り:中
シーケンシャル読み込み:高
小ランダムデータ書き込み:低
大シーケンシャル書き込み:中
高い
4 ランダム読み取り:高
シーケンシャル読み取り:高
ランダム書き込み:中
シーケンシャル書き込み:中
高い
5 ランダム読み取り:高
シーケンシャル読み取り:高
ランダム書き込み:中
シーケンシャル書き込み:中
高い
6 ランダム読み取り:高
シーケンシャル読み取り:高
ランダム書き込み:低い
シーケンシャル書き込み:中
とても高い

ひとりごと

3月になったら暖かくなるのかなと思いつつ、雪が降ったり、かと思えば桜が咲き始めたりと脈絡のない季節感に振り回されている。

世間ではロサンゼルス・ドジャースの来日で熱狂している。自分が中学生の時、テレビでの観戦だったがニューヨーク・ヤンキースが東京でMLB開幕戦を行ない、松井秀喜選手がホームランを打ったことを強く記憶している。

20代になってMLBのテレビ観戦にハマったのは、間違いなくあの時、目に焼きつけたことが影響しているはず。
今回の来日も現代の小中学生にとってそういう体験になればと思っている。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?