データマートという言葉、聞いたことはあるけれど、
実際それって何?
あるいは、なんとなく雰囲気で使っていないでしょうか。
まずは OracleのWebサイト(データマートとは)に書いてある定義を見てみます。
Oracle では、データマートは次のように説明されています。
データマートは、1つのサブジェクトまたはビジネスラインに焦点を絞った簡易形式のデータウェアハウスです。データマートを利用すれば、チームはより迅速にデータにアクセスし、インサイトを得ることができます。なぜなら、複雑なデータウェアハウス内の検索や、異なるソースからのデータの手動集計に時間を費やす必要がないためです。
……うーん、ちょっと難しい、、。
そこでこの記事では、この定義をもう少しかみ砕いて、
データマートとは結局どういうものなのか を、できるだけ腹落ちする形で整理してみます。
ざっくり言うと
- DWH:会社全体の分析用データを集約する土台
- データマート:その中から、部門や用途ごとに使いやすく切り出した分析用データ
つまり、データマートは
「分析しやすいように目的別に整えた、業務向けの小さな倉庫」
のようなものです。
1. まずDWHとは何か
データマートを理解するには、先にDWHとの関係を押さえるのが分かりやすいです。
DWH(Data Warehouse)は、売上・顧客・商品・在庫など、さまざまな業務データを集約し、分析しやすい形で蓄積するための仕組みです。
企業の意思決定やレポーティングのための、分析基盤の中心として使われてきました。
たとえば会社全体としては、
- 営業データ
- 販売データ
- 顧客データ
- 会計データ
などを横断して見たい場面があります。
そのために、まず全社的なデータを集めて整備する場所がDWHです。
2. データマートとは何か
データマート(Data Mart)は、
特定の部門や目的に合わせて、DWHや業務システムなどのデータソースから必要なデータを整理したもの です。
たとえば、
- 営業部向けの売上分析用データマート
- マーケティング部向けの顧客分析用データマート
- 経営層向けのKPI確認用データマート
のように、利用者ごとに見たいデータを使いやすい形でまとめる のが役割です。
「全社向けの大きな倉庫」がDWHだとすると、
データマートは 各部署が日常的に使う取り出しやすい棚 のようなイメージです。
3. DWHとデータマートの違い
違いを一言で言うと、対象範囲と目的 です。
| 項目 | DWH | データマート |
|---|---|---|
| 対象範囲 | 全社横断 | 部門・業務・用途単位 |
| 主な目的 | データを統合・蓄積する | 利用者が分析しやすくする |
| 利用者 | 全社の分析基盤 | 特定の部門やレポート利用者 |
| データの粒度 | 広く、元データに近いこともある | 目的に応じて絞り込み・集計済みであることが多い |
DWHは、分析基盤全体の土台です。
一方、データマートはその上に作る “使うための形” に近い存在です。
4. なぜデータマートが必要だったのか
昔から、分析基盤では「全部入り」のDWHだけあれば十分、というわけではありませんでした。
理由はシンプルで、
利用者が欲しいのは“全データ”ではなく、“自分に必要な見やすいデータ”だから です。
たとえば営業部が見たいのは、全社のあらゆるデータではなく、
- 月別売上
- 担当者別実績
- 製品カテゴリ別の販売傾向
のような、自分たちの意思決定に必要な切り口です。
そのため、DWHに入っている広範なデータをそのまま触らせるより、
必要な形に整理したデータマートを用意した方が、使いやすく、数字の定義も揃えやすい、というメリットがありました。
5. 単なる集計テーブルと何が違うのか
「それって集計テーブルと同じでは?」と思うかもしれません。
たしかに、データマートには集計済みデータが入ることも多いです。
ただし、データマートは単なる1つの表というより、特定業務の分析のために設計されたデータのまとまり です。
たとえば営業向けデータマートなら、
- 売上ファクト
- 顧客ディメンション
- 商品ディメンション
- カレンダーディメンション
のように、分析しやすい形で複数のテーブルやビューが整理されることがあります。
つまり、単なる一時的な集計結果というより、
部門向けの“分析用データモデル”に近い存在 と考えると分かりやすいです。
6. 今でもデータマートは必要なのか
最近のクラウドDWHやレイクハウスでは、昔より柔軟に大量データを扱えるようになっています。
分析基盤全体も、単なるデータベースではなく、蓄積・加工・提供までを含めた仕組みとして設計されるようになっています。
そのため、昔のように「部門ごとに物理的にデータマートをたくさん作る」構成は減ることもあります。
ただし、考え方としてのデータマートは今でも重要です。
たとえば今でも、
- BI向けに見せる指標を標準化したい
- 部門ごとに必要なデータだけ見せたい
- 複雑な元データを、そのまま利用者に触らせたくない
といった要件はよくあります。
その場合、物理テーブルとして作るか、ビューで表現するか、Semantic Layerで吸収するかは別として、
「利用者向けに整えた目的別データを提供する」という発想 は、今でもデータマートそのものです。
7. どういう場面で使うのか
たとえば、次のような場面でデータマートは分かりやすく役立ちます。
営業向け
商談件数、受注率、担当者別売上をすぐ見たい
マーケティング向け
流入経路別のCV、顧客属性別の反応を見たい
経営向け
全社KPIを月次で定点観測したい
このように、見る人・目的・指標がある程度決まっている分析 では、データマートは特に相性が良いです。
まとめ
データマートは、
DWHに蓄積されたデータを、部門や用途ごとに使いやすく整理した分析用データ です。
ポイントをまとめると、次のとおりです。
- DWHは全社横断の分析基盤
- データマートは部門・用途別に切り出した利用者向けデータ
- 単なる集計表ではなく、分析しやすいよう設計されたデータのまとまり
- クラウド時代でも、「利用者向けに整えて提供する」という考え方は今も重要
DWHやレイクハウスのような全体基盤の話を理解するうえでも、
“誰が使うためのデータなのか” という視点でデータマートを見る と、役割がかなり分かりやすくなると思います。






