LoginSignup
0
0

"The Data Warehouse toolkit"を読む

Last updated at Posted at 2023-11-05

1. ディメンショナルモデリング導入

ディメンショナルモデリングの利点

ディメンショナルモデリングは、データベース構成をシンプル化できる手法である。
以下二つの利点がある。

  1. ビジネスユーザにとって理解しやすい形式でデータ提供できる
  2. クエリを高速化できる

ディメンショナルモデリングの構成要素

ファクトテーブル

ビジネスイベントにおける"計測項目"を蓄積するテーブルである。(例:売上データ)
ファクトテーブルのレコード一つ一つが計測対象となるイベントに該当する。例えばファクトテーブルに売上というイベントを格納するならば、会計一回ごとにレコードが一行挿入される。この"一レコードに該当するイベントの細かさ"を"粒度"と呼び、ファクトテーブル全体を通して粒度は統一する必要がある。
ファクトとして有用な情報は、以下二つの要素を持つ。

  1. 数値データであること
  2. 加算可能なデータであること

特に"加算可能であること"が重要なのは、BIツール上で集計処理をおこなうためである。ファクトテーブルを一行一行表示することは稀であるため、集計できるように加算可能な量をファクトとして選ぶと良い。

ディメンションテーブル

ビジネスイベントにおける"文脈"を蓄積するテーブルである。
"文脈"とは、イベントにおいて「いつ、どこで、誰が、なぜ、何をしたか」を表す量である。(例:製品データ)
BIツール等で分析をする際に、分析の切り口やグルーピングとして使われる。

ファクトかディメンションかを如何に判断するか

数値データがファクトなのかディメンションなのか判断に迷うこともあるだろう。
一つの目安として「ある数値データが連続的な数値データであればファクト、離散的な数値データであればディメンション」という考え方がある。

"Kimball's DW/BI Architecture"

Kimballが提唱したデータアーキテクチャはOperational Source Systems, ETL Systems, Presentation Area, BI applicationという四つの構成要素からなる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0