この記事について
「ストレージ」という言葉は、IT業界に身を置く方々なら頻繁に遭遇する単語だと思います。
私自身、去年まで「データを格納するところ」ぐらいの感覚でした。
特に気にするのは購入するスマホだったりPCの容量を確認する時ぐらいでした笑
今年からストレージ業界に入り、やれプールだの、やれRAIDだのと、今までに聞いたこともないワードが津波のごとく押し寄せてきます。
この記事では、私のように最近IT業界に参入された方が読んで、
「この単語はこんな感じの意味合い」ぐらいに理解を深めていただけるよう書きました。
もちろんスキルアップのために詳しい勉強は必要になってきますが、「本格的な勉強の前に軽く理解したい」「ちょっと度忘れした」、
みたいな時に本記事を活用していただけたら幸いです。
理解しやすいようかなり砕けた言葉遣いで書いております。
ストレージ
ストレージ
ストレージとは、データを保管するシステムや装置のこと。一般的に、「HDD」「磁気テープ」「光ディスク(CD/DVD)」「SSD」などがあり、種類ごとに性能・容量・コストなどの特性があります。
コントローラ(ストレージコントローラ)
ストレージに搭載されている、「データ入出力専用に特化したコンピューター」です。
主に「CPU」「キャッシュメモリ」「ネットワークや記憶デバイスとの接続インターフェース」の3種類の部品で構成されています。
ドライブ
データを格納する物理的な装置。
「HDD」や「SSD」などがある。
HDD(Hard Disk Drive)
磁気ディスク装置のひとつ。
パソコンなど、ほとんどのコンピュータに搭載されている、代表的な外部記憶装置です。
しかし最近のパソコンはSSDが主流なので、あまり個人では使われなくなりつつあります。
古いパソコンだと起動したとき「ヒュイーーン」とHDDのディスクが回っている音がします。
物理的にディスクを回してデータを格納するので、読み書きに時間がかかります。
プラッター(磁気ディスク)・・・画像にあるCDみたいな円盤で、表面に磁性体が塗布さてれいる。磁性体の状態を変化させることで、1-0を表現して情報を格納する。
スピンドル・・・プラッターの真ん中にある、回転させるためのモーター。
磁気ヘッド・・・ディスクに乗っている尖ってる部品。磁界を発生させて、データの読み書きを行う。
スイングアーム・・・ 磁気ヘッドをプラッタ上で左右に移動させるためのアーム。
SSD(Solid State Drive)
フラッシュメモリを用いた記憶装置で、HDD の代わるものとされています。
SSDは、ヘッドやモーターといった機械的部分が存在しないため、耐衝撃性に優れ、
ヘッドを移動させるためのシークタイムがないため、HDDに比べ高速です。
さらに、消費電力も大幅に少なくなっており、グリーンITのひとつとして注目されている。
しかしHDDより高価、、、
最近はもう見なくなったUSBメモリですが、SSDの一種です。
シーク(ディスクシーク)
ディスクドライブにおいて、現在の位置から探しているデータが格納されているディスクの特定部分まで、ヘッドが移動すること。
これにかかる時間をシークタイムといいます。
プロセッサ
処理装置の総称で、コンピュータの中で機械語の命令文を実行しているハードウェア。
パソコンの中にあるプロセッサとしては、CPU(Central Processing Unit)が一般的です。
CPUの強化版プロセッサがGPU(Graphics Processing Unit)になり、
大量の計算処理能力が必要とされるコンピュータグラフィックスや機械学習に使われます。
※人間が書いたコードは人間が読むよう、それを機械が理解できるように翻訳(コンパイル)したものが機械語になります。
キャッシュ
直近に読み込んだデータや使用頻度が高いデータを高速な記憶装置(システムメモリ)に複製しておくこと。
これにより、よく使われるデータは高速にアクセスできます。
ヒット率
ディスクへのデータを探しに行ったときに、そのデータがディスクのキャッシュにある確率。
ラック
搭載するコンポーネントを規格の範囲内で自由に選択/配置できる筐体。
よく見るこんな感じの画像、中に色々入っている黒い外箱がラックで、中で青く光っているのがストレージやサーバ筐体です。
シェルフ
ストレージのディスク(HDD、SSDとか)を入れるための箱。
文字通りディスク入れる箱なので、よく「ボックス」とか言われています。
上の画像のラックに入っているもので「ストレージ」の外見はこんな感じです。
クラスタ
複数のなにか(コンピュータだったりストレージだったり)をまとめて1つの物として扱うこと。
例えばコンピュータクラスタだったら、一つのコンピュータをまとめて、
一つのコンピュータとして使用します。
これにより、一つのコンピュータでは処理できないような大量の要求に対して、
処理の負荷をクラスタ内にある複数のコンピュータに分配する事ができます。
ゲームで弱キャラのスライムが合体して中ボスになる感じです。
RAID (Redundant Arrays of Independent Disks)
HDDのクラスタリングをRAIDといいます。
複数のディスクを組み合わせることで、信頼性や性能を高める方法です。
もちろん一つのドライブとして認識・表示できます。
利点としては、一つのHDDが壊れたとしてもデータ復旧が出来たり(出来ないものもある)、
複数のHDDへの書き込みで、データの保存の高速化などがあります。
RAIDの中にも色々あって、データ配置の方法よって分類されます。
(主に気にするのは何本まで壊れても大丈夫か)
ストレージ・プール
これまたストレージのクラスタリング。
RAIDとの違いは厳密にはすご~~く細かい技術的な内容になってくるのであくまでも簡潔に。
ストレージプールはRAIDのようにただ物理的にディスクを合体させているのではなくて、
ネットワークに接続した複数のストレージ装置(ストレージ・ボリューム)の集合のこと。
このクラスタリングを仮想的行うことで、ストレージ装置の物理的な仕様や構成に依存しないスペース管理を実現できる。
ディスクストレージシステム
ディスクストレージシステム(Disk Array)とは、ハードディスク(磁気ディスク装置)を複数搭載し、大容量ディスクとして扱う技術・装置を指します。
外付けストレージ装置、ディスクストレージと呼ばれることもあります。
これの物理的な装置はハードウェア部分で説明したシェルフ、沢山ディスク積んでますよね?
ニアライン
ストレージ装置をアクセス性の観点で分別すると、ファイバチャネルディスクドライブ
(FC:ファイバチャネルと呼ばれる、ストレージ向けのネットワークプロトコル)のようなアクセス性の高い「オンライン」領域と、
テープドライブのような安いけど遅い「オフライン」領域の2つに分けらます。
「ニアライン」は、これらの中間に位置づけられる領域で、ストレージのアクセス性とコストのバランスをとる際の選択肢として選ばれます。
主な用途としては、アクセス頻度は低いが使用時には高速アクセスを必要とするデータの保存先や、ディスク to ディスクのバックアップ領域などです。
マウント
コンピュータ本体に接続した周辺機器をOSなどのソフトウェアに認識させ、操作・利用可能な状態にすること。
例えばWindowsで外部ストレージ(ボリューム)をマウントすると、こう見えます。
上がパソコン内蔵のストレージで、下が追加でマウントしたボリュームです。
混同しないように居所は分かれていて、内臓ストレージがC:、マウントしたストレージがI:といった具合になっています。
ボリューム
コンピュータから見て、外部のストレージを管理するときに使う数え方・単位。
不揮発性メモリ
記憶内容の保持に外部からの電源供給を必要としないメモリのこと。
CD-ROMとかは不揮発性メモリなので、電源供給無しでも記憶保持が可能。
逆に揮発性メモリとは電源を落としてしまうと記憶が飛んでしまいます。
コンピュータのRAMは揮発性メモリで、その場の処理のために記憶を一時的に保管するための媒体です。
なので電源を落としてしまうと記憶が飛びます。
性能の指標
スループット
単位時間当たりの処理能力やデータ転送量を測る指標です。
よく使われる単位はbits/second、またはbps。
IOPS
Input Output Per Secondの略で、単位時間あたりのRead/Write処理数を測ります。
この値が高いほど、処理能力が高いということになります。
帯域
電波などの周波数の範囲のことであり、「帯域幅(英語ではbandwidth)」 とも言ます。
データ通信の際は、通信に使用する電気信号の帯域(周波数の範囲)が広ければ広いほど、
多くの情報を送ることができるため、転送速度が向上します。
イメージとしては帯域がデータの流れる川の横幅、スループットは流れる水量みたいな感じです。
ストレージが使う回線が1Gbpsから3Gbpsに太くなったら、「帯域が広がった」と表現したりします。
Next Steps
この記事の内容は、私が入社してトレーニングを受けていた時のノートの初期の方から選びました。
まだまだ重要なワードありますので、どんどん記事に落とし込んでいこうと思います。
次回はストレージの機能面にフォーカスした記事を投稿予定ですので、そちらも読んでいただけたら幸いです!