はじめに
Microsoft Graph Data Connect (MGDC) は、Microsoft 365 データを安全に抽出し、分析基盤で活用できる強力な仕組みです。この記事では、Teams チャットのやり取りを Fabric 上で分析するまでの全体フローを紹介します。
参考ドキュメント:
全体の流れ
- Microsoft 365 管理センターで、Microsoft Graph Data Connect を有効にする
- Azure Portal または Microsoft Entra 管理センターで、Microsoft Entra アプリケーションを登録する
- Azure Portal または Microsoft Entra 管理センターで、Microsoft Entra アプリケーションを Microsoft Graph Data Connect に登録する
- Microsoft 365 管理センターで、登録されたアプリケーションを承認
- Microsoft Fabric のコピー アクティビティで、Graph データ接続のデータをレイクハウスに取り込む
- Microsoft Power BI でデータを視覚化する
太字 (2,3,5,6) が開発者の作業で、その他 (1,4) は Microsoft 365 管理者の作業です。
4.までの手順は冒頭に挙げた1つ目の参考ドキュメントの手順そのままですので、注意が必要なポイントだけ記載していきます。
多くはこちらのトラブルシューティングのドキュメントに記載されている内容です。
2. Microsoft Entra アプリケーションの登録
-
Azure Portal でアプリを登録し、アプリケーション (クライアント) ID とクライアント シークレットの値を取得します。

クライアント シークレットを作成したら、必ず「値」を安全な場所に保存してください。後から確認することはできません。
-
所有者に自分を追加し、API 権限に Microsoft Graph Data Connect 関連を設定します。アプリケーションの所有者は、次の要件を満たしている必要があります。
- ユーザー アカウントは、サービス プリンシパル名ではないテナント内の有効なユーザーに対応します。
- アカウントには、Exchange Online ライセンスが割り当てられている必要があります (メールボックスが必要です)。
- Exchange Online ライセンスと共に、アカウントには E5 サブスクリプション/ライセンスも使用している必要があります。
3. アプリケーションを Microsoft Graph Data Connect に登録
事前準備として、次の2点を確認します。
-
Microsoft.GraphServicesリソース プロバイダーを事前に登録
Azure Portal でサブスクリプションを開き、[リソース プロバイダー] でMicrosoft.GraphServicesが登録されていなければ、登録します。
以下の Azure CLI コマンドを使用して登録することもできます。az provider register -n Microsoft.GraphServices -
RBAC 権限に
Microsoft.Authorization/roleAssignments/writeが必要
サブスクリプションの所有者またはユーザー アクセス管理者ロールを付与するか、カスタム ロールを作成して付与する必要があります。
また、ロールを付与したら「アクティブ」になっていることを確認し、セッションを再起動 (Azure Portal をサインアウト&サインイン) してください。
上記を実施してから、Graph データ接続にアプリケーションを登録します。
- データセット(例:
Basicdata_v0.TeamChat_v2)と必要な列(例:Attachments以外)を選択します。 - データセットの設定が不足していると、Fabric パイプラインで
Invalid requested columnsエラーが発生します。
Graph データ接続で取得できるデータについては、こちらをご覧ください。
5. Fabric で Microsoft 365 コネクタを利用したコピー アクティビティを作成
- Fabric の Data Factory で コピー アクティビティを作成
- ソースに「Microsoft 365」を選択し、Graph Data Connect の設定を指定
- 同期先はレイクハウスやウェアハウスを選択可能
コピー アクティビティでデータソースを指定する際に、Graph データ接続のすべてのデータセットが表示されますが、ひとつ前の手順で指定したデータセットと列以外を指定するとエラーになります。
データ接続は大量のデータを一括して抽出するように設計されているため、データを抽出できるようになる前に、ある程度のオーバーヘッドが発生します。 このオーバーヘッドは約 45 分です。つまり、データ サイズに関わりなくすべてのパイプラインで、その程度の時間が最低必要になります。
「オーバーヘッドは約45分」とドキュメントに記載されていますが、検証テナント (データは少ない) で試したところ、18分ほどでした。
6. Teams チャットデータの分析
- コピー完了後、Fabric のレイクハウス/ウェアハウスにデータが保存されます。
- ノートブックや Power BI を使って、メッセージ頻度、添付ファイルの利用状況、チーム間のコミュニケーションパターンを分析できます。
ノートブックで分析する場合は、VS Code の Github Copilot に Fabric のノートブックであることを指定したうえで、やりたい分析を指示すると、必要なライブラリのインストールから、データの加工から、実際の分析までコーディングしてくれます。現時点ではまだ、Fabric ノートブックの Copilot より Github Copilot に軍配が上がる印象です。VS Code に Microsoft Learn の MCP サーバーを登録できるのが大きいのかもしれません。
Power BI で分析する場合には、レイクハウスの画面から [新しいセマンティック モデル] を作成します。リレーションシップは手作業で指定する必要がありますが、メジャー (計算項目) の作成は、[DAX クエリの記述] もしくは [DAX クエリ ビュー] を開いて Copilot に「できるだけ多くのメジャーを日本語で作成して」と指示するだけで、列名から判断して、素敵なメジャーを大量に作ってくれるのでおすすめです。
(今度詳しく書きたい)
(日本語ページの翻訳が遅れているようなので、ブラウザーの翻訳機能を使用してください。)
まとめ
Microsoft Graph Data Connect と Fabric を組み合わせることで、Microsoft 365 データを蓄積&分析できます。一度構築できれば強力な分析基盤が実現します。現時点では Microsoft Graph Data Connect の Fabric 連携はまだパブリック プレビューですが、ぜひお試しください。

