はじめに
Microsoft Fabric の Lakehouse について
- 「OneLake って SharePoint / OneDrive みたいなものでしょ?」
- 「じゃあ PDF や PowerPoint をレイクハウスに置いて、そこからプレビューして見ればいいよね?」
と なんとなく SharePoint 的な“ドキュメント置き場” として捉えている方がもしかしたらいるかもしれません。
ですが、レイクハウスの Files 領域は SharePoint とはまったく別物 であり、
現時点では PDF や PPTX を Fabric ポータルの画面上からプレビューすることはできません。
この記事では、
- レイクハウスの Files 領域で 実際にプレビューできるファイル形式
- Lakehouse Files と SharePoint のすみ分け(人間向け vs AI/処理向け)
あたりを整理しておきます。
「とりあえず全部 OneLake にまとめておくか〜」と考えている人の誤解を、
ほんの少しだけ是正できればうれしいです。
▽pptxはFabricレイクハウスのfile領域でプレビューはできない

Fabric レイクハウスの Files 領域でプレビューできる形式一覧
まず大前提として、レイクハウスの Files 領域は OneLake (= ADLS Gen2) 上に乗っているので、
ファイルとして「置ける」形式にはほぼ制限はありません。
CSV / Parquet / JSON はもちろん、PDF・PPTX・ZIP・MP4 など、なんでもアップロードできます。
ただし、「Fabric ポータルのレイクハウス画面からそのままプレビューできるかどうか」は別の話 です。
上記ドキュメントの「ファイル プレビュー」の項に記載されている通り、
現時点で レイクハウスの画面上からプレビューできる拡張子は限られています。
ここで重要なのは、
このリストに おそらく皆さんが良く使う非構造化データ
pdf / pptx / docx などは含まれていない
という点です。
つまり、レイクハウスの Files に PDF や PowerPoint を置いても、Fabric ポータルから中身を直接プレビューすることはできません。
(クリックするとダウンロードになるだけ、という挙動になります)
▽関連動画
Lakehouse Files 領域と SharePoint の使い分け
結論をざっくりまとめると、
- 人間が読む・レビューするための資料 → SharePoint / OneDrive
-
AI や Notebook / Dataflow で処理するための素材 → Lakehouse Files
という住み分けで考えるのが、今のところ一番しっくりきます。
SharePoint は「人間のためのドキュメント基盤」
SharePoint / OneDrive は、もともと
- Office ファイル(Word / Excel / PowerPoint)
- PDF などのビジネス文書
を
- ブラウザ上でプレビュー・編集
- バージョン管理
- 共同編集・コメント・承認フロー
といった 「人間が読む/編集する」ための機能 とセットで提供するドキュメント基盤です。
そのため、
- 社内向け提案資料
- 会議体への報告資料
- 契約書類の PDF
などを 「社員が閲覧するための置き場」 として使うのは、やはり SharePoint が本筋です。
Lakehouse Files は「処理・AI のためのデータレイク」
一方で、レイクハウスの Files 領域は公式ドキュメントでも
- 「生データを置くランディングゾーン」
- 「未加工データを格納するエリア」
といったニュアンスで説明されています。
これらを Notebook / Dataflow / Pipeline などから処理するための“素材置き場”として利用します。
LHにPDF / PPTX を Lakehouse に置くのが “アリ” なケース
- PDF を Notebook(Python)で読み取り、全文テキストを抽出して Delta テーブル化したい
- PPTX からスライドのテキストやメタデータを抽出し、後段の AI(RAG、Data Agent、Copilot)から検索できるようにしたい
つまり、
「メダリオンアーキテクチャに組み込んで処理を回す前提で、元データとして保管したい」時は レイクハウスのファイル領域を使っていきます。
逆に、イマイチなケース
特に AI や Notebook から使う予定はないけど、ファイルの置き場を統一したいから、社内の PDF / PPTX も全部 Lakehouse に突っ込んでおくか」
これは技術的には可能ですが、
- プレビューできない
- ドキュメント管理機能(権限、共同編集、メタデータ、ワークフロー)が弱い
- SharePoint 側との役割分担が曖昧になる
といった理由から、あまりおすすめできません。
Lakehouse Files はあくまで、
ユースケースドリブンで「処理・AI で使うものだけを置いていく」
という設計方針が良いと思っています。
非構造化データのメダリオンアーキテクチャは発展途上
非構造化データのメダリオンアーキテクチャ自体、
まだ世の中的にもベストプラクティスが固まりきっていない領域です。
参考資料:
おわりに(重要ポイントの再整理)
- レイクハウスの Files 領域は「なんでも置ける」けど、「なんでもプレビューできる」わけではない
- 現時点では PDF / PPTX / DOCX / XLSX はプレビュー非対応
-
人間が読む資料 → SharePoint / OneDrive
処理・AI のための素材 → Lakehouse Files - Lakehouse に PDF / PPTX を置くのは「AI や Notebook で処理するユースケースがある時だけ」
Fabric / OneLake を触っていると、つい「全部ここに集約したい」気持ちになりますが、
“データレイクとしての Lakehouse” と “ドキュメント基盤としての SharePoint” は役割が違う
という点を意識しておくと、後々の運用が非常に楽になります。
Youtubeもやってます!
Microsoft Data Analytics Day(Online) 勉強会 にて
この記事の内容で登壇しました!
FabricやDatabricksについて学べる勉強会を毎月開催!
次回イベント欄から直近のMicrosoft Data Analytics Day(Online) 勉強会ページ移動後、申し込み可能です!

