はじめに
こんにちは!株式会社マクニカでDatabricksのセールスエンジニアをしているtm_mtaishiです。
Databricksとは?(マクニカ紹介ページ)
今回は、新機能であるUnity Catalog Metrics について触ってみました。
想定背景
データ活用を進める中で、部門やBIツールごとでKPI/指標の定義がバラバラになっていることが少なくないと思います。
(例えば、データがシステムやダッシュボードごとに散在し、同じ”売上”でも画面によって値が違う・・・など)
Unity Catalog についても、テーブル・ファイル・モデルなどを統合管理してきましたが、ビジネスメトリクスはユーザー側で管理していく形でした。
機能概要
Unity Catalog Metrics 機能は、例えば「売上」「在庫」「受注数」などのKPIの集計ロジックを定義し、組織共通の“標準メトリクス”として一元管理できる機能です。
定義した内容は、すぐにダッシュボードやGenieにて利用することが可能となります。
これにより、
- 部門やチームをまたいだ共通KPI/指標の管理
- 経営・現場のダッシュボードやレポートで“定義された同じ数字”の活用
など、データ活用の標準化を推進します。
現場の分析担当者から経営層まで、誰でも同じ定義のメトリクスを利用できることが大きな特徴です!
Metric Viewと従来のビューとの違い
従来のビューは、簡単に言うとSQLクエリの結果をそのまま保存しているものです。
その為、GROUP BYなどで粒度を変えようと思うと、それに応じてロジックを構築し新規ビューを作る、ということが発生します。
それに対して、Metric Viewは、”指標ロジックそのもの”を定義するので、どこからでも同じ定義で呼び出し、柔軟に集計・可視化をすることができるようになります!
(具体的には、ビジネス指標(Measures)と切り口(Dimensions)をそれぞれ定義するので、利用時に必要な粒度で集計できます)
その為、定義の変更も柔軟に可能で、変更した場合もMetric Viewを使って作成したオブジェクトにすぐに反映されます。
ビジネス指標(Measures)の定義
Metric Viewのメジャー(Measures)では、単純なSUM/AVGだけでなく、さまざまな集計ロジックや条件式も記述できます。
記事公開時点でサポートされている項目としては以下のとおりです。
- SUM、AVG、MAX、MIN、COUNTなどの基本集計
- 四則演算の組み合わせ 例:SUM(売上) / SUM(販売数)(平均単価KPIなど)
- CASE式やIF式による条件付き集計 例:SUM(CASE WHEN 在庫 < 在庫MIN THEN 1 ELSE 0 END)(在庫不足件数)
- スカラー関数の利用 例:ROUND(SUM(売上), 0)
- DISTINCT COUNTやNULLIF、COALESCE等
一方で、現時点では以下は非対応のようです。
- サブクエリやウィンドウ関数(ROW_NUMBERなど)
- JOINや複数テーブル横断の式(Metric View内で完結する式のみ対応)
検証
今回は、”製造業の在庫・発注データ”を例に
- Metric Viewの作成
- KPIの集計ロジック定義(例:在庫・部材発注合計など)
- ダッシュボードや自然言語での分析
といった流れを一通り試してみました。
Metric Viewの定義
Catalog画面から該当テーブルを選択し、「Create」>「Metric View」をクリック。
YAML形式でディメンションや集計値(measures)を記述することで、組織共通の指標が簡単に定義できます。
尚、日本語カラムやスペースを含む列も、バッククォート指定で問題なく対応できました。
Metric Viewの内容確認・利用
作成したMetric ViewはCatalog上で即時参照・再利用が可能です。
定義したKPIやディメンションは自動的に一覧表示され、編集や再定義もGUIから容易に行えます。
BI機能との連携
Metric Viewを基に、そのままダッシュボードを作成できます。
先ほど定義したメトリクスを用いて、ダッシュボードを表示させることができます。
さらに、Genieから「○○の推移を可視化して」など自然言語でのクエリが可能となり、現場ユーザーでもノーコードで可視化・分析できます。
現場ユーザーでもノーコードで必要なデータ探索・グラフ化ができるのは大きな強みです。
補足
DatabricksのBI機能のみならず、TableauやPower BIなど外部ツールからも同じ定義で呼び出せすことができます!
また、記事公開時点ではPreview機能となる“Ask Genie”にて、チャット形式で自然言語のクエリを投げることで、事業部門が欲しい情報をすぐに可視化させることができました!
これにより、Genie Spaceで参照するテーブルを選択しなくとも、よりラフに質問することが可能になりました。
まとめ
Unity Catalog Metrics は、
- KPI/指標のロジックをYAMLで一元管理し、全社で統一した指標を活用できる
- 定義したメトリクスは現場担当者から経営層まで誰でも簡単に利用可能
- ガバナンスや改修がしやすいシンプルな設計
- ダッシュボードやGenieとシームレスに連携できる
という機能であることが分かりました。
感想
実際に使ってみて、Metric ViewはKPI/指標の標準化・再利用を強力に後押しするだけでなく、組織全体のデータ活用サイクルを圧倒的にシンプルかつスピーディーにしてくれると感じました!共通指標の浸透や現場主導のセルフサービス分析を推進したい方には、おすすめの新機能です。