はじめに
夜のPower BI 勉強会 での発表スライドです。
BIを構築し始め、徐々に規模が大きくなっていったとき、どうしたらいいのかを考えてみた。
(実際にその局面になっているわけではないので、あくまでも想像)
具体的には データセットが次第に大きくなってきて、Power BI Desktopでインポートに時間がかかるようになってきたどうするのかなぁ
巨大なデータをローカルで扱わなくてもいい方法はないのか・・と考えてみた。
やってみたこと
Power BI Desktopを使用せずに、Tabular Editor だけでPower BI Service上にデータセットを構築する。
前提条件
Power BI Premium ワークスペースが作成できること
Premium per Capacity か Premium per user ライセンスが必要です。
XMLAエンドポイント
のRead/Writeが許可されていること
Power BI 管理者 のロールが必要です。
XMLAエンドポイント
の設定方法
- Power BI Serviceの設定から管理ポータルに進みます。
- 容量の設定→容量の名前をクリック
- ワークロードを展開して、
XMLAエンドポイント
を読み取り、書き込みに変更する。
(ほぼ)空っぽのレポートをPower BI Serviceにアップ
プレミアム容量のワークスペースであることを確認。
ワークスペースの設定画面から、URL形式の接続文字列をコピー。
Tabular Editorを開いて接続する
File -> Open -> Model from DB
クリック。
URL形式の接続文字列を貼り付け
無事、読込完了
Power BI Service上のデータセットに接続できました。
最初に作成したテーブルが読み込まれています。
テーブルをインポートする。
Model -> Import tables
- Provider (aka. Legacy): Analysis Servicesのすべてのバージョン、すべての互換性レベルで利用できます。限られた範囲のソースをサポートしており、主にOLE DB/ODBCライバによるリレーショナルデータをサポートしています。パーティションは通常、ソースに対してネイティブに実行されるSQLステートメントを使用して定義されます。認証情報は、Tabular Object ModelのProvider Data Sourceオブジェクトで管理され、サーバー側で保存および暗号化されます。
- Structured (aka. Power Query): SQL Server 2017(互換性レベル1400+)から利用可能。レガシープロバイダーよりも広範囲のデータソースをサポートします。パーティションは通常、M(Power Query)式を使って定義します。認証情報はTabular Object ModelのStructured Data Sourceオブジェクトで管理され、Analysis Servicesへの展開時に毎回指定する必要があります。
- Implicit data sources: Power BIデータセットでのみ使用されます。モデル内に明示的なデータソースオブジェクトは作成されません。代わりに、M(Power Query)式でデータソースを暗黙的に定義します。認証情報はTabular Object Modelには保存されず、Power BI DesktopまたはPower BI Serviceによって管理されます。
任意のデータソースを選択
あとはダイアログ通り進めていくと、テーブルの選択画面にすすみます。
ここでテーブル選択をして、必要に応じて、取り込むカラムも選択します。
取り込み完了
テストデータとして、商品情報(一部)と担当販売部名を取り込んでみました。
CTRL + S
で保存 -> Refresh するとPower BI Service上でも確認できます。
Power BI Serviceで確認します。UPされています。Tabular Editorのテーブル情報とも一致します。
ただこのままでは、それぞれのテーブル間でリレーションが構成されていないため、ビジュアルを作成することはできません。
リレーションの構築
New Dialog
を選択。
テーブル名をドラッグアンドドロップし、リレーションを構築したいカラムをマウスでつなげてあげると、視覚的にリレーションを作成することが出来ます。
リレーションシップが完成
TOM Explorer
のRelationships
フォルダにリレーションを示すオブジェクトができたことを確認できます。ダイアログツールを使用せずに、ここで直接リレーションを作成することも可能ですが、複雑になってくると管理もできなくなりますので、こういったビジュアルツールが有るのは助かりますね。
ビジュアルの作成
リレーションも正しく設定できているので、Power BI Serviceで複数テーブルからデータをもってきてビジュアルを作成することができています。
Power Query で 書いてみる。
今度はテーブルの作成時に、Power Queryを使用してみます。まだintellisenseは使えるようになっていないので、ここでゴリゴリPower Queryでの開発は(私は)難しい。
テーブルを新規で作成し、
Expression Editor で Power Query を記述。
Schema Update を実行
データプレビューも可能
Power BI Serviceにも連携されていることを確認
Power Query のサポートはロードマップに掲載されているので、実装されるのを楽しみに待ちたいと思います。
完成
Power BI Desktopを経由せずにデータセットを作成、リレーションシップの設定、Power BI Service上でビジュアルの構築ができました。Tabular Editor を利用すれば、大規模データセットの運用も怖くない!
大規模BIの運用・開発には配置パイプラインを使用して開発環境を作成する運用も検討できますね。
要注意
一度でもXMLAエンドポイント経由でデータセットを触ったら、そのPBIXファイルはPower BI Service上にしか存在できなくなります。ご利用は計画的に
公式Document