概要
「Code-Driven データ分析ナイト #2 セマンティックレイヤー」にて、「データ利活用における
セマンティックレイヤー概要」というタイトルで発表しました。本記事では、その発表内容を整理してご紹介します。
資料
実行コード
リンク先のレポジトリにて、dbt Platform での MetricFlow、 Snowflake Semantic Layer、 Databricks Metric View をほぼ同じロジックで実装しています。
発表内容補足
セマンティックレイヤーとは
DMBOK 出版元である DAMA による The DAMA Dictionary of Data Management, 2nd Edition にて Semantic Layer が定義されています。
A representation of data using business terms to enable ease of understanding and use.
Ref: The DAMA Dictionary of Data Management, 2nd Edition
理解や活用を容易にするためのビジネス用語を用いたデータ表現。
上記翻訳
データ利活用におけるセマンティックレイヤーとは
2つのセマンティックレイヤーが注目されており、データマネジメント業界では Knowledge Graph によるセマンティックレイヤーが注目されている領域であり、どちらの話をしているかに注意が必要です。
Knowledge Graph に関する記事として下記を投稿しております。
- GraphDB を無償で利用できる Graphwise Sandbox を試しみた #rdf - Qiita
- Supply Chain Reference Ontology のサンプルデータを data.world でクエリする方法 #SPARQL - Qiita
- Databricks と GraphDB にて Microsoft GraphRAG with an RDF Knowledge Graph の記事を実行する方法 #MicrosoftGraph - Qiita
- クラウド型データカタログサービス data.world の無償版で学ぶ SPARQL 実践ガイド #SPARQL - Qiita
<補足>Knowledge Graph によるセマンティックレイヤー
Knowledge Graph によるセマンティックレイヤー機能については、 Graphwise 社の資料が参考になります。
出所:What Is a Semantic Layer | Graphwise Fundamentals
2025年10月22日~23日に開催された Graphwise AI Summit 2025 について下記でまとめています。
データ利活用におけるセマンティックレイヤーの実践
Databricks と Snowflake に格納されている TPC-H データを用いてサンプルコードを作成しています。ディメンショナルモデリングである TPC-DS を利用していない理由は、TPC-DS のデータモデルが整い過ぎており、例外パターンを含む検証シナリオを設定しにくいためです。データ利活用におけるセマンティックレイヤーを実装する際には、ディメンションモデル(スタースキーマ、スノーフレークスキーマ)で実装してください。
TPC-H と TPC-DS については下記の記事で整理しています。

