この記事について
- 以下の書籍の読書メモです
アジャイルデータモデリング-組織にデータ分析を広めるためのテーブル設計ガイド
データウェアハウスのモデリング手法
アジャイルデータモデリングとは
- DWHの設計プロセスにビジネスサイドのステークホルダーを積極的に関与させるアジャイル開発手法
- 1回のイテレーションでは、スタースキーマ、ETLプロセス、BIレポート/ダッシュボードを「動くソフトウェア」として提供する
ディメンショナルモデリングとは
- ビジネスプロセスを
指標(ファクト)と説明(ディメンション)で定義するDWHのデータモデリング手法 - ファクトは集計結果、ディメンションは集計結果の分析軸(事業領域や、商品)
- OLTPで言うERモデリングのように、結合パスが複雑にならないので、ユーザーが分析しやすい
スタースキーマとは
- ディメンショナルモデリングの設計図
- イメージ: https://www.databricks.com/jp/glossary/star-schema
- OLTPデータベースでいう、ER図の代わりになるもの
- どのビジネスプロセスの値(ファクト)を、どのような基準(ディメンション)で集計するか
データウェアハウスの分析と設計
データベースの設計に必要なもの
- データベースのモデリングの前に、業務プロセスの分析が必要
データ駆動分析
- ユーザーの意見を聞かずに、単にER技術を使って複数のデータソースを再モデリングする
- 「それ(システム)を作ればきっと彼(ユーザー)は来る」
レポート駆動型分析
- ユーザーが何を求めているかを読み解くことで、データに求められる要件を整理する
- ユーザーからのヒアリングから、「モデリングすべき基礎となるビジネスプロセス」を見つけることがポイント
アジャイルなデータウェアハウス設計
- イテレーションごとに、ユーザーからのフィードバックを得ながら開発を行う
- 1回のイテレーションで提供できる成果物は
- 1つのスタースキーマ
- スタースキーマを作るための ETLプロセス
- スタースキーマにアクセスするダッシュボード