はじめに
こんにちは!2025年11月17日に開催されたMicrosoft Ignite 2025で、Microsoft Fabricに関する実践的なハンズオンセッション「PREL14: Unify data, act on insights, and build AI solutions with Microsoft Fabricc」に参加してきました。このセッションは、データ統合からAIソリューション構築まで、Fabricの全体像を体験できる貴重な機会でした。
本記事は全3部構成のシリーズとなっており、第1部ではセッション全体の概要とMicrosoft Fabricの基本概念、そして環境構築の手順について解説します。
このシリーズで学べること
- 第1部(本記事): Microsoft Fabricの概要と基本概念、環境構築
- 第2部: OneLake、Lakehouse、Data Warehouseによるデータ統合基盤の構築
- 第3部: Data Agents(Copilot)とPower BIを活用したAI駆動のデータ分析
対象読者
- Microsoft Fabricに興味がある方
- データ統合基盤の構築を検討している方
- AI/MLをデータ分析に活用したい方
- 従来のデータウェアハウスからの移行を考えている方
セッション概要
セッションの目的
このセッションは、Microsoft Fabricを使用して以下を実現する方法を学ぶことを目的としていました:
- データの統合: 様々なデータソースを一つのプラットフォームに統合
- インサイトの活用: 統合されたデータから迅速に洞察を得る
- AIソリューションの構築: 統合データを基にAI駆動のソリューションを構築
セッションの構成
ハンズオンラボは以下の6つのモジュールで構成されていました:
00 - Introduction (イントロダクション)
01 - Getting Started (環境構築)
02 - Lakehouse (レイクハウス)
03 - Data Warehouse (データウェアハウス)
04 - Data Agents (データエージェント/Copilot)
05 - Power BI (ビジュアライゼーション)
06 - Conclusion (まとめ)
セッションの進め方と参加者のバックグラウンド
セッション開始時に、参加者のスキルレベルとバックグラウンドの確認が行われました。これは、セッション内容を参加者に合わせて調整するための重要なステップでした。
参加者のバックグラウンド確認:
- Sparkユーザー(PySpark/Scala): 数名
- T-SQL開発者: 多数(会場の大半)
- データ統合/ETL開発者: 複数名
- Power BI / BIレポート開発者: 複数名
- データサイエンティスト: 数名
- マネージャー: 数名
- その他(CTO、アーキテクトなど): 数名
この確認を踏まえて、セッションの難易度レベルは150〜200程度(初級〜中級)に設定されました。これは、技術的な深堀りよりも、Fabric全体の理解と実践的な使い方に焦点を当てることを意味します。
学習スタイルへの配慮:
セッションでは、参加者の学習スタイルに応じて3つのアプローチが提示されました:
- 視覚的学習: デモ画面を見ながら理解
- 聴覚的学習: 説明を聞きながら理解
- 実践的学習: ハンズオンラボで実際に操作
この柔軟なアプローチにより、4時間以上のハンズオン時間で、各自のペースで学習を進められる環境が整っていました。
Microsoft Fabricとは
統合型データプラットフォームの誕生背景
従来、企業のデータ分析基盤は複数の製品を組み合わせて構築する必要がありました:
- データ統合: Azure Data Factory
- データウェアハウス: Azure Synapse Analytics
- ビジネスインテリジェンス: Power BI
- データサイエンス: Azure Machine Learning
- リアルタイム分析: Azure Stream Analytics
これらを個別に管理・運用するには、以下のような課題がありました:
- 複数のサービス間でのデータコピー
- 各サービスの個別課金と複雑なコスト管理
- サービス間のセキュリティとガバナンスの統合困難
- チーム間のコラボレーションの障壁
Microsoft Fabricが解決する課題
Microsoft Fabricは、これらすべてを単一のSaaS(Software as a Service)プラットフォームとして統合したソリューションです。
主な特徴
-
OneLake - 統合データレイク
- 組織全体で単一のデータレイクを共有
- データの重複を削減
- すべてのワークロードで同じデータを使用
-
統一された課金モデル
- Fabricキャパシティユニットによる一元管理
- 必要に応じてスケールアップ/ダウン
- すべてのワークロードで同じリソースプールを使用
-
7つのコアワークロード
- Data Factory: データ統合とETL/ELT
- Synapse Data Engineering: Sparkベースのデータ処理
- Synapse Data Warehouse: エンタープライズDWH
- Synapse Data Science: ML/AIモデル開発
- Synapse Real-Time Analytics: リアルタイムデータ処理
- Power BI: ビジュアライゼーション
- Data Activator: イベント駆動型アクション
-
Copilot統合
- 自然言語でのデータクエリ
- AIアシストによるコード生成
- レポート作成の自動化
セッションで紹介された実際の顧客事例
セッション中、Fabricチームが担当した実際の顧客事例が紹介されました。
ある大規模小売企業では、Azure Synapse Analytics Dedicated SQL Pool(DW30000)を最大容量で使用していました。数千店舗のデータを処理していたにもかかわらず、基本的な変換処理でも全体の20%のデータしか処理できない状況でした。DW30000は当時の最大スケールでしたが、それでもキャパシティが不足していたのです。
この企業がFabricに移行した結果は驚くべきものでした:
移行後の成果:
- パフォーマンス: 2倍向上
- コスト: 半減
- 処理データ量: 5倍に増加(20% → 100%)
- 移行期間: わずか6週間
これらの数字は、Fabricが単なる機能統合ではなく、根本的なアーキテクチャの改善によって実現されていることを示しています。
Microsoft Fabricのアーキテクチャ
OneLake - すべての基盤
OneLakeは、Fabricのすべてのワークロードが共有する統一データレイクです。OneDriveがドキュメントを一元管理するのと同様に、OneLakeはデータを一元管理します。
OneLakeの主な特徴
┌─────────────────────────────────────────────────
│ OneLake (統合データレイク)
│ すべてのFabricワークロードが共通で使用
├─────────────────────────────────────────────────
│
│ • Delta Parquet形式での標準化ストレージ
│ • ショートカット機能(他のストレージへの参照)
│ • ミラーリング(リアルタイム同期)
│ • 統一セキュリティとガバナンス
│
└─────────────────────────────────────────────────
↑ ↑ ↑ ↑
│ │ │ │
Lakehouse Warehouse Data Science Power BI
ショートカット機能
ショートカットは、データを物理的にコピーせずに他のストレージ(Azure Blob、S3、ADLSなど)のデータを参照できる機能です。これにより:
- データの重複を回避
- ストレージコストを削減
- データのオーナーシップを維持したまま共有
ミラーリング機能
セッションでも説明がありましたが、ミラーリングは既存のデータベース(Snowflake、Azure SQL、Cosmos DBなど)をほぼリアルタイムでOneLakeに同期する機能です。
ミラーリングの利点:
- ETLパイプラインの構築不要
- トランザクションログベースの効率的な同期
- 運用データベースへの負荷最小化
- 追加のストレージコスト不要
ワークスペースとアイテム
Fabricでは、すべての作業は「ワークスペース」という論理的なコンテナ内で行われます。
ワークスペース
├── Lakehouse (データレイク + SQL エンドポイント)
├── Data Warehouse (エンタープライズDWH)
├── Dataflow Gen2 (データ変換)
├── Pipeline (オーケストレーション)
├── Notebook (Sparkコード)
├── Semantic Model (データモデル)
├── Report (Power BIレポート)
└── Data Agent (Copilotエージェント)
環境構築 - Getting Started
前提条件
ハンズオンラボを開始する前に、以下が必要です:
-
Microsoft Fabricへのアクセス
- Fabric有効化済みのテナント
- またはFabric試用版(60日間無料)
-
ブラウザ
- 最新のChrome、Edge、Firefoxなど
-
サンプルデータ
- セッションでは、実際の小売業のサンプルデータを使用
ワークスペースの作成
Step 1: Fabric ポータルへのアクセス
- ブラウザで
https://app.fabric.microsoft.comにアクセス - Microsoft 365アカウントでサインイン
Step 2: Fabricトライアルの有効化(初回のみ)
試用版を使用する場合:
- 右上のアカウントマネージャーをクリック
- 「Start trial」を選択
- クレジットカード不要で60日間利用可能
重要: 既存のPower BIアカウントがある場合、同じアカウント情報でFabricにアクセスできます。テナント管理者がFabricへのアクセスを無効化している場合、この手順が表示されないことがあります。
Step 3: 新しいワークスペースの作成
1. 左側のメニューバーから「Workspaces」を選択
2. 「+ New workspace」をクリック
3. ワークスペース名を入力(例: "Ignite2025-Fabric-Lab")
4. 説明を追加(オプション)
5. ライセンスモードを選択
- Trialを使用する場合: 「Trial」を選択
- Premium容量を使用する場合: 容量を選択
6. 「Apply」をクリック
Fabricエクスペリエンスの切り替え
Fabricには複数の「エクスペリエンス」があり、それぞれ異なるペルソナ向けに最適化されています:
- Data Engineering: データエンジニア向け
- Data Factory: ETL/ELT開発者向け
- Data Science: データサイエンティスト向け
- Data Warehouse: DWH開発者向け
- Real-Time Intelligence: リアルタイムデータアナリスト向け
- Power BI: BIアナリスト向け
左下の「Fabric」アイコンをクリックすることで、エクスペリエンスを切り替えられます。
サンプルデータの準備
このハンズオンラボでは、以下のサンプルデータセットを使用します:
- Customers: 顧客マスタデータ
- Products: 製品マスタデータ
- Sales: 販売トランザクションデータ
- Returns: 返品データ
セッションでは、これらのサンプルデータが事前に準備されたラボ環境で提供されました。実際の環境では、Azure Blob StorageやADLS Gen2からデータを取り込むことになります。
セッションでの技術的な補足
Fabric Data Warehouseの性能特性
セッションでは、Fabric Data Warehouseの性能について詳しい説明がありました。
従来のDedicated SQL Pool(DW30000が最大)と比較した主な違い:
- 自動スケーリング: ワークロードに応じて自動的にスケール
- Out-of-the-boxパフォーマンス: 複雑なチューニング不要
- コスト効率: 必要な時だけリソースを使用
セッション中の学び
実際のハンズオンセッションでは、いくつかの技術的な調整が必要な場面もありました。例えば、ラボ環境のセットアップに時間がかかり、セッションの進行順序を柔軟に調整する場面がありました。
このような実際のトラブルシューティングの様子を見ることで、本番環境での運用時に注意すべきポイントも学べました:
- 環境構築には余裕を持った時間設定が重要
- 複数のモジュールを準備しておき、柔軟に順序を変更できる構成にする
- 参加者の理解度を確認しながら進行する
ベストプラクティス
ワークスペース管理
-
命名規則の統一
- プロジェクトや環境ごとに明確な命名規則を定義
- 例:
[環境]-[プロジェクト名]-[目的]
-
ロールベースアクセス制御(RBAC)
- Admin: フル権限
- Member: コンテンツの作成・編集
- Contributor: 既存コンテンツの編集のみ
- Viewer: 閲覧のみ
-
開発・テスト・本番環境の分離
- 各環境に個別のワークスペースを作成
- Git統合を活用したCI/CD
キャパシティ管理
-
適切なキャパシティサイズの選択
- F64以上: Copilot機能が利用可能
- ワークロードに応じて選択
-
Capacity Metrics Appの活用
- リアルタイムでの使用状況監視
- ボトルネックの特定
- コスト最適化
よくある質問(セッションQ&Aより)
Q: 既存のAzure Synapse Analyticsからの移行は難しいですか?
A: セッションでは、多くの顧客が6週間程度で移行できているとの説明がありました。主な手順は:
- データのミラーリングまたはショートカット設定
- ETLパイプラインの再構築(多くの場合、より簡素化される)
- レポートの移行(Power BIは互換性が高い)
Q: OneLakeのデータは他のツールからアクセスできますか?
A: はい、OneLakeはDelta Lake形式(オープンフォーマット)を使用しているため:
- Azure Databricksから直接アクセス可能
- Apache Sparkエコシステムとの互換性
- ベンダーロックインの心配なし
Q: セキュリティとガバナンスはどのように管理しますか?
A: Fabricは以下を提供します:
- Microsoft Purview統合による統一ガバナンス
- 行レベルセキュリティ(RLS)
- 列レベルセキュリティ(CLS)
- データマスキング
- 監査ログとコンプライアンス機能
まとめ
第1部では、Microsoft Ignite 2025で体験したFabricセッションの概要と、Microsoft Fabricの基本概念、環境構築の手順について解説しました。
この記事のポイント
- Microsoft Fabricは、データ統合からAI活用までを単一プラットフォームで実現
- OneLakeによる統一データレイクで、データサイロを解消
- 既存システムからの移行は想像以上にスムーズ(6週間の事例)
- パフォーマンスとコストの両面で大きな改善が可能
次回予告
第2部では、実際にOneLake、Lakehouse、Data Warehouseを使用してデータ統合基盤を構築する具体的な手順を解説します:
- Lakehouseの作成とデータ取り込み
- Data Warehouseの構築とスキーマ設計
- ショートカットとミラーリングの実践的な活用
- データ変換とETL/ELTのベストプラクティス
第2部では、セッションで実際に行ったハンズオン内容を詳しく紹介しますので、お楽しみに!
参考リンク
公式ドキュメント
Microsoft Learn
セッション関連
コミュニティ
シリーズ記事
- 第1部: Microsoft Fabricとは何か(本記事)
- 第2部: OneLakeとLakehouse/Data Warehouseで実現するデータ統合基盤(次回)
- 第3部: Data AgentsとPower BIで実現するAI駆動のデータ分析(次々回)
関連タグ: #MicrosoftFabric #Ignite2025 #OneLake #DataWarehouse #Azure #PowerBI #AI #データ統合