0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【DWH】Data Warehouseについて調べてみた

Last updated at Posted at 2025-09-05

そもそもDWH(Data Warehouse)とは何か

 DWHは、分析のために最適化された「整理されたデータの倉庫」です。複数システムから集約したデータを、あらかじめ定義したスキーマで「主題別(顧客・商品・売上など)」に整理し、時系列で長期保管、更新・削除を基本行わない形で蓄積します。これにより、部署横断で同じ“ものさし”の数値を高速に集計・可視化できます。

DWHの歴史

1990年代初頭:
 W. H. Inmon が DWH を体系化。DWH を「分析に最適化された倉庫」として位置づけました。

2000年代:
 OLAP(オンライン分析処理)製品・ETL製品が普及。DWH は「分析の土台」、周辺ツールが「活用の推進役」という役割分担が明確になりました。

2010年代以降:
 当時、マーケティング領域では「DMP(Data Management Platform)」が登場し、DWHで統合したデータを広告配信・MAなどアクションツールへ橋渡しする文脈が広がります。

現在:
 クラウドの進化で「データレイクとDWHの収斂(レイクハウス的な発想)」が進み、「格納場所の違いよりどう価値化するか」が重視される流れになりました。

DWHの位置づけと基本構造

image.png

 DWH はしばしば 3層構造(データレイク/DWH/データマート)の「真ん中」に置かれます。

①データレイク:
 ローデータ(rawdata)を幅広く蓄積

②DWH(Data Warehouse):
 クレンジング・ID マッピング・集計などを終えた 分析向けの整形済みデータ を保存

③データマート:
 BI・MAなど目的別に切り出した最終利用データ

この3層をシステム内でも分けて管理し、再利用性・運用の非属人化・コスト最適化を図る設計が定石です。

DWHの主な特徴

①主題別(Subject-Oriented):
 顧客・商品・売上など分析の主語ごとにモデル化

②統合(Integrated):
 部門・システムの違いを吸収し、統一粒度・コード体系で一元化

③非可変(Nonvolatile):
 履歴は基本「追記のみ」

④時系列(Time-Variant):
 過去から現在までの時間軸で保管・分析する前提

参考

参考:DWHとDMPの違いは?歴史から紐解く比較
https://bdash-marketing.com/marketics/marketing/2334/

参考:Oracle Docs「What is a Data Warehouse?」
https://docs.oracle.com/cd/B10501_01/server.920/a96520/concept.htm?utm_source=chatgpt.com

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?