AI Ready なデータ基盤とは何か

Last updated at 2026-05-14Posted at 2026-05-14

AI エージェント時代に「データ基盤」の定義が変化

2025〜2026 年にかけて、自然言語で SQL を生成し分析結果を返す「AI 分析エージェント」が実用段階に入りました。
しかし、AI が SQL を書けることと、AI がビジネスの問いに正しく答えることは別の話です。組織横断で AI 分析エージェントを展開しようとすると、「LLM の SQL 生成能力」ではなく「データ基盤そのものが AI Ready かどうか」が成否を分けることが明らかになってきました。

本記事では、AI Ready なデータ基盤 を以下の 2 軸で定義し、Microsoft Fabric がその実現手段としてどのように進化してきたかを整理します。

軸	定義
データ整備	メダリオンアーキテクチャで、データを多様な分析に耐えうる形に整えて提供
データのコンテキストを提供	セマンティックモデルやオントロジーを使用して、データの意味・関係・ルールを AI が読める形で提供

軸1：メダリオンアーキテクチャで「分析に耐えうるデータ」を整備

なぜ「形を整える」が最初に必要か

AI エージェントにとって最大の障壁は、生データの粒度がバラバラで定義が不統一なことです。組織内で同じ KPI の定義が部署ごとに異なっていたり、複数の SaaS・業務システム間で粒度が一致しなかったりする状態では、LLM がどれだけ優秀でも正しい SQL は書けません。

メダリオンアーキテクチャの役割

メダリオンアーキテクチャ（Bronze → Silver → Gold）は、この問題を段階的に解消する設計パターンです。

レイヤー	役割	AI Ready への貢献
Bronze	ソースシステムからの生データを変換なしで取り込み	データの網羅性と再現性を確保
Silver	クレンジング・型統一・重複排除・結合	ビジネスドメインごとの一貫した粒度を実現
Gold	分析用途に最適化された集計・ビュー	多様な分析パターン（セグメント別・期間別・コホート別）に耐えうるベーステーブル群

AI エージェントが参照すべきは Silver〜Gold のレイヤーです。ここが整っていれば、AI は「毎回ゼロから集計する」のではなく「整備されたベーステーブルを使い回す」ことになり、SQL 生成の精度・速度・コストが一気に安定します。

Fabric でのメダリオンアーキテクチャの実装

Microsoft Fabric は、メダリオンアーキテクチャの実装をネイティブに支援する構成を備えています。

OneLake: すべてのレイヤーのデータを Delta/Parquet で統一管理する単一データレイク
ショートカット / ミラーリング: 外部データソース（Snowflake / PostgreSQL / S3 / Dataverse 等）を ETL なしで参照し、Bronze の網羅性を確保
Lakehouse: Bronze〜Silver の加工処理を Spark / Dataflow Gen2 / Pipeline で実行
Warehouse: Gold レイヤーの分析用テーブルを T-SQL で提供

従来であれば ETLツール + Spark エンジン + DWH を個別に構築・接続する必要がありましたが、Fabric はこれを 1 つのワークスペース内で完結させます。「データの形を整える」という軸 1 の作業を、インフラの整備が出来上がった状態から、素早く、段階的に進められる基盤になっています。

軸2：セマンティックモデルとオントロジーで「データのコンテキスト」を提供

データの整備だけでは AI は正しく答えられない

軸1 でテーブルの粒度を整えても、AI がビジネスの文脈を理解できなければ回答はズレます。

「月次売上」はどのテーブルのどのカラムをどう集計したものか
「返品処理中の注文は売上集計から除外する」という暗黙ルールは誰が管理しているか
「顧客」「注文」「商品」「サプライヤー」はどのような関係にあるか

これらは人の頭にあって AI には見えない情報です。この情報を「AI が読める形」に構造化することが軸2 の本質です。

セマンティックモデル - 出発点としてのメトリクス定義

Power BI セマンティックモデル（旧データセット）は、業務語彙 (セマンティック) を構造化する出発点として機能します。データに関する一貫したルールを提供します。

メジャー定義：「売上」「粗利」「解約率」、それらの「前年比」などの計算式を DAX で一元定義
リレーションシップ：テーブル間の結合関係を明示
階層：年 → 四半期 → 月 → 日のドリルダウン構造

これは、基本的なセマンティックレイヤーです。「先月と今月の売上をチャネル別に比較して」のような集計分析には高い精度で答えられますが、「サプライヤーA社からの供給が滞った場合に影響が出る商品とその出荷先はどこか」のような深掘り分析には対応が難しくなります。

セマンティックモデルは単なるセマンティックレイヤーというだけでなく、クエリ最適化、パフォーマンス最適化のエンジンを含んでおり (一問一答的なやり取りではなく) 多角的な集計分析に最適化されたクエリエンジンです。

Fabric IQ：セマンティックモデルの「その先」

Microsoft は 2025 年後半に Fabric IQ ワークロードを発表し、セマンティックモデルの上位にさらに豊かなコンテキスト層を積む方向に進化させました。Fabric IQ に含まれる主要アイテムは以下の通りです。

Fabric において「ワークロード」というのは機能のかたまりのようなもので、実際に操作する際には「アイテム (項目)」を作成していきます。

アイテム	提供するコンテキスト
Ontology (preview)	エンティティ型・プロパティ・リレーションシップ型を定義し、ビジネス概念の階層・同義語・派生関係を機械可読に外在化
Graph in Microsoft Fabric (preview)	エンティティ間のリレーションをラベル付きプロパティグラフとして格納。GQL によるパス探索・コミュニティ検出・影響分析が可能
Ontology Rules (preview) + Fabric Activator	業務ルール（「在庫 < 閾値 → 補充」「特定条件で除外」）をオントロジー上で宣言的に定義し、アクションを自動実行
Data Agent	自然言語クエリを構造化クエリに変換（NL2Ontology）。最適なバックエンド（GQL / KQL / SQL）に自動ルーティング
Plan (preview)	計画データと実績データを統合し、意思決定とアクションの橋渡し

オントロジーとセマンティックモデルの関係

Fabric IQ はセマンティックモデルを否定するものではありません。両者は以下のように段階的に積み重なる設計になっています。

セマンティックモデルからオントロジーを自動生成できる（既存資産の活用）
オントロジーで定義した語彙がセマンティックモデルと一貫性を保つ
セマンティックモデルが持たないクロスドメインの関係推論・業務ルール・グラフ探索はオントロジーが担う

これは「入り口としてセマンティックモデルから始め、事業成長に合わせてオントロジーに拡張する」という段階的アプローチを可能にする設計です。

3つの IQ ワークロード：組織全体のコンテキストを AI に供給

Fabric IQ だけでなく、Microsoft は組織の知識を AI エージェントに供給するために 3つの IQ ワークロード を展開しています。

IQ ワークロード	対象	提供するコンテキスト
Fabric IQ	Microsoft Fabric 上の分析データ	ビジネスオントロジー・セマンティックモデル・グラフ・業務ルール
Foundry IQ	Azure Foundry 上のエンタープライズデータ	構造化/非構造化データ横断のパーミッション対応知識検索（RAG）
Work IQ	Microsoft 365 上の協業データ	ドキュメント・会議・チャット・ワークフローから得られる作業文脈

この 3 つを組み合わせることで、AI エージェントは以下を同時に参照できます。

Fabric IQ: 「売上」「顧客セグメント」「商品カテゴリ」の定義と関係
Foundry IQ: 社内ドキュメントに書かれた業務ルールや過去の分析レポート
Work IQ: 「先週の経営会議で議論されたキャンペーン方針」

これは、AI エージェントが深掘り分析を行う際に必要とするビジネス概念の定義・エンティティ間の関係・業務ルール・組織固有の前提条件といったコンテキストの全体を、マネージドサービスとしてカバーしようとする構想です。

Fabric の進化の軌跡：2軸の実現に向けた段階的な機能追加

Fabric が AI Ready データ基盤の 2 軸をどのように段階的に実現してきたかを時系列で整理します。

時期	機能追加	対応する軸
2023 年 5 月	Fabric 発表（OneLake / Lakehouse / Warehouse 統合）	軸1: メダリオンの基盤
2023〜2024 年	Dataflow Gen2 / Pipeline / ミラーリング / ショートカット拡充	軸1: データ統合の容易化
2024 年	セマンティックモデルの Direct Lake モード GA	軸2: セマンティック層の性能改善
2025 年 10 月	Graph in Microsoft Fabric (preview)	軸2: ナレッジグラフ
2025 年 11 月	Fabric IQ / Ontology (preview) 発表	軸2: ビジネスオントロジー
2026 年 3 月	Ontology Rules + Fabric Activator	軸2: 業務ルール辞書
2026 年 3 月	Plan (preview)	軸2: 計画とアクション
2026 年	Foundry IQ / Work IQ との連携	軸2: 組織横断コンテキスト

この軌跡を見ると、Fabric は当初「軸1: データの形を整える」（OneLake + Lakehouse + メダリオン）を固めた後、2025 年後半から「軸2: データのコンテキストを提供する」（Fabric IQ + Ontology + Graph）に本格投資するフェーズに入ったことがわかります。

段階的アプローチ

AI Ready データ基盤は一度に完成するものではありません。以下のような段階的アプローチが現実的です。

Step 1: メダリオンでデータの形を整える

OneLake + Lakehouse で Bronze〜Silver を構築
ビジネスドメインごとにベーステーブル（Gold）を整備
一貫した命名・粒度・分類規則を確立

Step 2: セマンティックモデルで分析を安定させる

Power BI セマンティックモデルで主要 KPI を一元定義
Direct Lake モードでパフォーマンスを確保
様々な角度からの集計分析

Step 3: オントロジーで深掘り分析を可能にする

セマンティックモデルからオントロジーのベースを自動生成
エンティティ間のリレーションシップを Graph で表現
業務ルールを Ontology Rules で構造化
Data Agent で NL2Ontology による自然言語クエリを提供

Step 4: 3つの IQ で組織横断のコンテキストを供給する

Foundry IQ で社内ドキュメント・過去分析の知識基盤を接続
Work IQ で協業シグナルをエージェントに供給
評価ハーネス（Foundry Evaluation 等）で回答品質を継続モニタリング

まとめ

Microsoft の外の人の正直なご意見として、こちらもご覧いただくとよろしいかと思います。

私個人としても、セマンティックモデルなど、既にGAしている機能だけでも AI エージェント連携は結構できると思っています。
一方で、先進企業はオントロジーに取り組み始めているのも事実です。ぜひ Step1, 2, 3 そして 4 へと歩みを進めていただければと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

AI Ready なデータ基盤とは何か

AI エージェント時代に「データ基盤」の定義が変化

軸1：メダリオン アーキテクチャで「分析に耐えうるデータ」を整備

なぜ「形を整える」が最初に必要か

メダリオン アーキテクチャの役割

Fabric でのメダリオン アーキテクチャの実装

軸2：セマンティック モデルとオントロジーで「データのコンテキスト」を提供