はじめに
- 現在、AWSソリューションアーキテクトアソシエイト試験に向けて勉強中
- Redshiftの「列指向データベース」についてよくわからなかったので、調べてみました。
そもそも、「行指向データベース」ってあるの?
- 普段みなさんが使っているリレーショナルデータベースは行指向データベース
- SQLなどを使ってデータを抽出する時は、行を抽出する
「行指向データベース」の問題点
- 特定の列だけを抽出したい場合でも、まずは行全体を読み取らないといけない
- 必要以上のデータを読み取らないといけないため、データ量が膨大になれば処理が遅くなってしまう
「列指向データベース」
- 行指向データベースではできなかった、列だけを抽出することができるデータベース
- これによって、必要データを効率的に抽出することができる
- 特定の列のデータを使ってデータ分析をしたい場合に有効
- AWSでは、Redshiftが代表例
まとめ
- Redshiftに代表される「列指向データベース」は、特定の列データを抽出できるデータベースで、データ分析時に活用される
- 実際のRedshiftの使い方などは、今後勉強してアップデートしようと思います