はじめに
Power BI には様々なサードパーティ製ツールがありますが、今回ご紹介する Measure Killer は、不要なメジャーや列を簡単に見つけ出して削除するツールです。この「不要な」というのがポイントで、メジャーだけでなく列やテーブルも含めてレポート内で使用されているかどうかを一発で検出してくれます。
素晴らしいことに、すべてのオフライン機能は、個人的にも商業的にも無料で使用できます。
これは、Power BI Desktop ファイル (.pbix) に対する操作は無料の範囲でできるということです。
有償の機能には、メジャーなどを削除するだけでなく、テナント内の Power BI アイテムの管理に関するあらゆることができるようになっているので、組織の Power BI 管理者の方が泣いて喜ぶ機能が満載です。
サイトを見ると (公開日時点で) 年間599スイスフラン (日本円で12万円くらい) で利用できるようですが、この記事では無料で使える使用されていないメジャーや列を削除する機能にフォーカスして紹介します。
なぜ使っていないメジャーや列を削除するのか
Excel などのファイルからデータを集めて可視化しているくらいであれば、セマンティック モデルに多少の使っていない列が含まれていても、大した問題ではありません。ところがこれが Viva Insights のテンプレートのように、組織の数千~数万人ものユーザーの働き方に関するログを1年分集めて分析するともなると、自分たちが見たいのはいくつかのレポートページだけなのに、データ項目が多すぎて整理がつかないということがあるかと思います。レポートサイズの肥大化により、レポートのメンテナンスやセキュリティ (見せたくない項目がレポートに含まれていないか)、ストレージやメモリ、コンピューティング リソース (CU) の消費などの面で問題となってきます。Power BI のガイダンス資料の インポート モデリングのデータ削減手法 では、余計な列を削除することが、まず最初に挙げられていることからも、重要性が分かるかと思います。
メジャーについては、使用される時に計算されるので、それ自体はあまり問題にならないのですが、その元となる列の削除可否に関わってきます。
メジャーと似て非なるものが 計算列 (Calculated Column) です。メジャーと同様に DAX 式で定義するのですが、セマンティック モデルの更新時に計算処理が実行されます。Power Query エディターで列を作成するのと比較して圧縮率が低くなりますし、更新にかかる時間も長くなる可能性があります。削除効果が大きいのが計算列です。
Measure Killer の使い方
-
Measure Killer は冒頭のサイトからインストール可能です。
Microsoft Store 経由でインストールするのが楽ですが、ストアが使用できない場合はダウンロードしてインストールしてください。 -
インストールしたら、まず目的の .pbix ファイルを Power BI Desktop で開きます。レポートで使われていないものを判別したいので、使用しないレポート ページは削除します。
心配な人はファイルをあらかじめバックアップしておいてください。 -
接続先のセマンティック モデルを選択するダイアログが表示されるので、ひとつ前の手順で開いている .pbix ファイル名が選択されていることを確認して [Next] をクリックします。
Measure Killer の起動後に .pbix ファイルを開いた場合は、[Refresh ports] ボタンをクリックすることで、選択できるようになります。 -
起動したら、左上の [Run] ボタンをクリックします。
(「Let Measure Killer do it's magic」という吹き出しが良いですね)
-
ほどなくして分析結果が表示されます。(大きなファイルの場合、それなりに時間かかります。)
緑の Used と赤の Unuserd はその名の通りですが、黄色の Used by unused というのは、メジャーで使われているものの、そのメジャーがレポートで使われていないような場合です。
-
[Kill measures and Calc. columns] タブに移動すると、使用されていないメジャーと計算列を削除することが可能です。[Kill] ボタンをクリックすると .pbix ファイルから選択したメジャーを削除します。
-
[Kill columns] タブに移動すると、選択したテーブルごとに、既存のクエリに列を削除するステップを追加するMコードが表示されます。「Remove other columns」がデフォルトで選択されており、残す列を指定して、それ以外の列を削除するためのコードを生成しています。
Measure Killer からは直接クエリを編集できないため、生成されたコードをコピーして使用します。
-
Power BI Desktop で Power Query エディターを開いて、Measure Killer でコードを生成した対象のクエリを選択し、[ホーム] → [詳細エディター] をクリックします。
-
「Columns removed by Measure Killer」というステップが追加されたのが確認できます。[ホーム] → [閉じて適用] をクリックします。
不要なメジャーと列を削除する流れは以上です。
なお、画面上部にある [Restore] ボタンで、削除したメジャーを選択して元に戻すことができます。選んで戻せるなんて、賢すぎる。列の削除を戻したいときは、Power Query エディターで「Columns removed by Measure Killer」というステップを削除すればOKです。
まとめ
「Power BI の容量がひっ迫しているから、レポートのスリム化をしよう!」と思ったものの、膨れ上がった .pbix ファイルを前にどこから手を付けるべきか途方に暮れている方は、ぜひ使ってみてください!