AI エージェント時代に「データ基盤」の定義が変化
2025〜2026 年にかけて、自然言語で SQL を生成し分析結果を返す「AI 分析エージェント」が実用段階に入りました。
しかし、AI が SQL を書けることと、AI がビジネスの問いに正しく答えることは別の話です。組織横断で AI 分析エージェントを展開しようとすると、「LLM の SQL 生成能力」ではなく「データ基盤そのものが AI Ready かどうか」が成否を分けることが明らかになってきました。
本記事では、AI Ready なデータ基盤 を以下の 2 軸で定義し、Microsoft Fabric がその実現手段としてどのように進化してきたかを整理します。
| 軸 | 定義 |
|---|---|
| データ整備 | メダリオン アーキテクチャで、データを多様な分析に耐えうる形に整えて提供 |
| データのコンテキストを提供 | セマンティック モデルやオントロジーを使用して、データの意味・関係・ルールを AI が読める形で提供 |
軸1:メダリオン アーキテクチャで「分析に耐えうるデータ」を整備
なぜ「形を整える」が最初に必要か
AI エージェントにとって最大の障壁は、生データの粒度がバラバラで定義が不統一なことです。組織内で同じ KPI の定義が部署ごとに異なっていたり、複数の SaaS・業務システム間で粒度が一致しなかったりする状態では、LLM がどれだけ優秀でも正しい SQL は書けません。
メダリオン アーキテクチャの役割
メダリオン アーキテクチャ(Bronze → Silver → Gold)は、この問題を段階的に解消する設計パターンです。
| レイヤー | 役割 | AI Ready への貢献 |
|---|---|---|
| Bronze | ソースシステムからの生データを変換なしで取り込み | データの網羅性と再現性を確保 |
| Silver | クレンジング・型統一・重複排除・結合 | ビジネスドメインごとの一貫した粒度を実現 |
| Gold | 分析用途に最適化された集計・ビュー | 多様な分析パターン(セグメント別・期間別・コホート別)に耐えうるベーステーブル群 |
AI エージェントが参照すべきは Silver〜Gold のレイヤーです。ここが整っていれば、AI は「毎回ゼロから集計する」のではなく「整備されたベーステーブルを使い回す」ことになり、SQL 生成の精度・速度・コストが一気に安定します。
Fabric でのメダリオン アーキテクチャの実装
Microsoft Fabric は、メダリオン アーキテクチャの実装をネイティブに支援する構成を備えています。
- OneLake: すべてのレイヤーのデータを Delta/Parquet で統一管理する単一データレイク
- ショートカット / ミラーリング: 外部データソース(Snowflake / PostgreSQL / S3 / Dataverse 等)を ETL なしで参照し、Bronze の網羅性を確保
- Lakehouse: Bronze〜Silver の加工処理を Spark / Dataflow Gen2 / Pipeline で実行
- Warehouse: Gold レイヤーの分析用テーブルを T-SQL で提供
従来であれば ETLツール + Spark エンジン + DWH を個別に構築・接続する必要がありましたが、Fabric はこれを 1 つのワークスペース内で完結させます。「データの形を整える」という軸 1 の作業を、インフラの整備が出来上がった状態から、素早く、段階的に進められる基盤になっています。
軸2:セマンティック モデルとオントロジーで「データのコンテキスト」を提供
データの整備だけでは AI は正しく答えられない
軸1 でテーブルの粒度を整えても、AI がビジネスの文脈を理解できなければ回答はズレます。
- 「月次売上」はどのテーブルのどのカラムをどう集計したものか
- 「返品処理中の注文は売上集計から除外する」という暗黙ルールは誰が管理しているか
- 「顧客」「注文」「商品」「サプライヤー」はどのような関係にあるか
これらは人の頭にあって AI には見えない情報です。この情報を「AI が読める形」に構造化することが軸2 の本質です。
セマンティック モデル - 出発点としてのメトリクス定義
Power BI セマンティック モデル(旧データセット)は、業務語彙 (セマンティック) を構造化する出発点として機能します。データに関する一貫したルールを提供します。
- メジャー定義: 「売上」「粗利」「解約率」、それらの「前年比」などの計算式を DAX で一元定義
- リレーションシップ: テーブル間の結合関係を明示
- 階層: 年 → 四半期 → 月 → 日のドリルダウン構造
これは、基本的なセマンティック レイヤーです。「先月と今月の売上をチャネル別に比較して」のような集計分析には高い精度で答えられますが、「サプライヤーA社からの供給が滞った場合に影響が出る商品とその出荷先はどこか」のような深掘り分析には対応が難しくなります。
セマンティック モデルは単なるセマンティック レイヤーというだけでなく、クエリ最適化、パフォーマンス最適化のエンジンを含んでおり (一問一答的なやり取りではなく) 多角的な集計分析に最適化されたクエリ エンジンです。
Fabric IQ:セマンティック モデルの「その先」
Microsoft は 2025 年後半に Fabric IQ ワークロードを発表し、セマンティック モデルの上位にさらに豊かなコンテキスト層を積む方向に進化させました。Fabric IQ に含まれる主要アイテムは以下の通りです。
Fabric において「ワークロード」というのは機能のかたまりのようなもので、実際に操作する際には「アイテム (項目)」を作成していきます。
| アイテム | 提供するコンテキスト |
|---|---|
| Ontology (preview) | エンティティ型・プロパティ・リレーションシップ型を定義し、ビジネス概念の階層・同義語・派生関係を機械可読に外在化 |
| Graph in Microsoft Fabric (preview) | エンティティ間のリレーションをラベル付きプロパティグラフとして格納。GQL によるパス探索・コミュニティ検出・影響分析が可能 |
| Ontology Rules (preview) + Fabric Activator | 業務ルール(「在庫 < 閾値 → 補充」「特定条件で除外」)をオントロジー上で宣言的に定義し、アクションを自動実行 |
| Data Agent | 自然言語クエリを構造化クエリに変換(NL2Ontology)。最適なバックエンド(GQL / KQL / SQL)に自動ルーティング |
| Plan (preview) | 計画データと実績データを統合し、意思決定とアクションの橋渡し |
オントロジーとセマンティック モデルの関係
Fabric IQ はセマンティック モデルを否定するものではありません。両者は以下のように段階的に積み重なる設計になっています。
- セマンティック モデルからオントロジーを自動生成できる(既存資産の活用)
- オントロジーで定義した語彙がセマンティック モデルと一貫性を保つ
- セマンティック モデルが持たないクロスドメインの関係推論・業務ルール・グラフ探索はオントロジーが担う
これは「入り口としてセマンティック モデルから始め、事業成長に合わせてオントロジーに拡張する」という段階的アプローチを可能にする設計です。
3つの IQ ワークロード:組織全体のコンテキストを AI に供給
Fabric IQ だけでなく、Microsoft は組織の知識を AI エージェントに供給するために 3つの IQ ワークロード を展開しています。
| IQ ワークロード | 対象 | 提供するコンテキスト |
|---|---|---|
| Fabric IQ | Microsoft Fabric 上の分析データ | ビジネス オントロジー・セマンティック モデル・グラフ・業務ルール |
| Foundry IQ | Azure Foundry 上のエンタープライズ データ | 構造化/非構造化データ横断のパーミッション対応知識検索(RAG) |
| Work IQ | Microsoft 365 上の協業データ | ドキュメント・会議・チャット・ワークフローから得られる作業文脈 |
この 3 つを組み合わせることで、AI エージェントは以下を同時に参照できます。
- Fabric IQ: 「売上」「顧客セグメント」「商品カテゴリ」の定義と関係
- Foundry IQ: 社内ドキュメントに書かれた業務ルールや過去の分析レポート
- Work IQ: 「先週の経営会議で議論されたキャンペーン方針」
これは、AI エージェントが深掘り分析を行う際に必要とするビジネス概念の定義・エンティティ間の関係・業務ルール・組織固有の前提条件といったコンテキストの全体を、マネージドサービスとしてカバーしようとする構想です。
Fabric の進化の軌跡:2軸の実現に向けた段階的な機能追加
Fabric が AI Ready データ基盤の 2 軸をどのように段階的に実現してきたかを時系列で整理します。
| 時期 | 機能追加 | 対応する軸 |
|---|---|---|
| 2023 年 5 月 | Fabric 発表(OneLake / Lakehouse / Warehouse 統合) | 軸1: メダリオンの基盤 |
| 2023〜2024 年 | Dataflow Gen2 / Pipeline / ミラーリング / ショートカット拡充 | 軸1: データ統合の容易化 |
| 2024 年 | セマンティック モデルの Direct Lake モード GA | 軸2: セマンティック層の性能改善 |
| 2025 年 10 月 | Graph in Microsoft Fabric (preview) | 軸2: ナレッジグラフ |
| 2025 年 11 月 | Fabric IQ / Ontology (preview) 発表 | 軸2: ビジネス オントロジー |
| 2026 年 3 月 | Ontology Rules + Fabric Activator | 軸2: 業務ルール辞書 |
| 2026 年 3 月 | Plan (preview) | 軸2: 計画とアクション |
| 2026 年 | Foundry IQ / Work IQ との連携 | 軸2: 組織横断コンテキスト |
この軌跡を見ると、Fabric は当初「軸1: データの形を整える」(OneLake + Lakehouse + メダリオン)を固めた後、2025 年後半から「軸2: データのコンテキストを提供する」(Fabric IQ + Ontology + Graph)に本格投資するフェーズに入ったことがわかります。
段階的アプローチ
AI Ready データ基盤は一度に完成するものではありません。以下のような段階的アプローチが現実的です。
Step 1: メダリオンでデータの形を整える
- OneLake + Lakehouse で Bronze〜Silver を構築
- ビジネスドメインごとにベーステーブル(Gold)を整備
- 一貫した命名・粒度・分類規則を確立
Step 2: セマンティック モデルで分析を安定させる
- Power BI セマンティック モデルで主要 KPI を一元定義
- Direct Lake モードでパフォーマンスを確保
- 様々な角度からの集計分析
Step 3: オントロジーで深掘り分析を可能にする
- セマンティック モデルからオントロジーのベースを自動生成
- エンティティ間のリレーションシップを Graph で表現
- 業務ルールを Ontology Rules で構造化
- Data Agent で NL2Ontology による自然言語クエリを提供
Step 4: 3つの IQ で組織横断のコンテキストを供給する
- Foundry IQ で社内ドキュメント・過去分析の知識基盤を接続
- Work IQ で協業シグナルをエージェントに供給
- 評価ハーネス(Foundry Evaluation 等)で回答品質を継続モニタリング
まとめ
Microsoft の外の人の正直なご意見として、こちらもご覧いただくとよろしいかと思います。
私個人としても、セマンティック モデルなど、既にGAしている機能だけでも AI エージェント連携は結構できると思っています。
一方で、先進企業はオントロジーに取り組み始めているのも事実です。ぜひ Step1, 2, 3 そして 4 へと歩みを進めていただければと思います。
