そもそもDWH(Data Warehouse)とは何か
DWHは、分析のために最適化された「整理されたデータの倉庫」です。複数システムから集約したデータを、あらかじめ定義したスキーマで「主題別(顧客・商品・売上など)」に整理し、時系列で長期保管、更新・削除を基本行わない形で蓄積します。これにより、部署横断で同じ“ものさし”の数値を高速に集計・可視化できます。
DWHの歴史
1990年代初頭:
W. H. Inmon が DWH を体系化。DWH を「分析に最適化された倉庫」として位置づけました。
2000年代:
OLAP(オンライン分析処理)製品・ETL製品が普及。DWH は「分析の土台」、周辺ツールが「活用の推進役」という役割分担が明確になりました。
2010年代以降:
当時、マーケティング領域では「DMP(Data Management Platform)」が登場し、DWHで統合したデータを広告配信・MAなどアクションツールへ橋渡しする文脈が広がります。
現在:
クラウドの進化で「データレイクとDWHの収斂(レイクハウス的な発想)」が進み、「格納場所の違いよりどう価値化するか」が重視される流れになりました。
DWHの位置づけと基本構造
DWH はしばしば 3層構造(データレイク/DWH/データマート)の「真ん中」に置かれます。
①データレイク:
ローデータ(rawdata)を幅広く蓄積
②DWH(Data Warehouse):
クレンジング・ID マッピング・集計などを終えた 分析向けの整形済みデータ を保存
③データマート:
BI・MAなど目的別に切り出した最終利用データ
この3層をシステム内でも分けて管理し、再利用性・運用の非属人化・コスト最適化を図る設計が定石です。
DWHの主な特徴
①主題別(Subject-Oriented):
顧客・商品・売上など分析の主語ごとにモデル化
②統合(Integrated):
部門・システムの違いを吸収し、統一粒度・コード体系で一元化
③非可変(Nonvolatile):
履歴は基本「追記のみ」
④時系列(Time-Variant):
過去から現在までの時間軸で保管・分析する前提
参考
参考:DWHとDMPの違いは?歴史から紐解く比較
https://bdash-marketing.com/marketics/marketing/2334/
参考:Oracle Docs「What is a Data Warehouse?」
https://docs.oracle.com/cd/B10501_01/server.920/a96520/concept.htm?utm_source=chatgpt.com