ハードディスクに書き込みと削除を繰り返していくと空きのプラッタが分散してしまう。
このような分散した状態をフラグメンテーション(断片化)
と言う。
これによりアクセス速度は遅くなり、アクセス時間が長くなる。
デフラグで再整理
フラグメンテーションが生じてアクセス時間が長くなるがその中のシーク(位置決め)に時間がかかる。
(一つのファイルの内容を断片化した空きの容量にそえぞれ振り分けられているから)
断片化したファイルのデータを連続した領域に並べ直してフラグメンテーションを解消する。
この作業をデフラグメンテーション
と言う。
問題を解いた時の気づき
疑問 データベース応答性能とは?
数千万・何億件ものデータを格納するデータベースに対して検索を行う時、こういう台詞を「言う・聞く」事があります。数千件や数万件の規模であれば瞬きする程度で結果が表示
されますが、数千万や「億」といった単位に差し掛かると、データベース性能は「僕らの期待値」から徐々にずれ始めていきます。
...
このような経験を日々積み重ねていくと「あ、なんか引っかかるなぁ」とか「このアプリ遅いなぁ」と感じる事が増えてきます。
...
単純に言えば「CPU性能」を向上させるのが有効と言えるケースがあると思います。
ですが、「数千万、数億件」というデータを取り扱い始めると、重要となるのは「CPU性能」よりも「記憶装置」
と言えます。
数億件ものデータを格納する「記憶装置」の動きが遅ければ、どれだけ「CPU性能」を向上させたとしても大きな改善はない可能性が高い。
...
ハードディスクは円盤状の磁気ディスクを高速に回転させ、磁気ヘッドを物理的に移動させながら情報の記録・参照を行います。このような物理的な動作がある以上、どこまで処理速度は上限に到達し、お客様の期待値からずれ始めていきます。
...
「半導体チップを利用したストレージ装置」です。パソコン業界に詳しい方であれば「SSD」(Solid State Drive) と言えばご理解いただけると思います。
...
ハードディスク装置と比較して驚く程の高速性能が発揮されます。2倍? 3倍くらい? いえいえ「数十倍以上」という表現が適しています。物理的に部品が動くわけではないので、故障率もぐっと低くなります。
出典 https://www.synergy-marketing.co.jp/blog/database-response-time
疑問 カットオーバーとは?
新しく開発されたシステムが稼動すること
気づき
データベース応答性能とは検索して結果が表示される時間のことを言うのか。
それには記憶装置の性能が大きく作用しているのか。
またハードディスクよりもSSDの方が早いのか。
これからSSDについては勉強していくのかな。