Power BI の Power Query エディターで使用するクエリ・パラメータの使い方について考えます。レポートで使用する What-ifパラメーターではありません。
クエリ・パラメータは、クエリの中の値を別の場所に記述することで、メンテナンスがしやすくなります。例えば、エクセルファイルの保存場所とか、APIのキーなどをパラメータにして、PBIXファイルを他の人に配布したり、別の環境で使いたいときなど、Power Queryの中身を書き換えることなく使えるので便利です。ただし、PCの環境変数を参照するようなことはできません。
A.クエリ・パラメータとテンプレート
1.任意の値:データソースの参照先にパラメータを使う
※参照: パラメーターを使用します。
通常、Webからのデータを取得するのには、以下のダイアログにURLを入力します。
Power Query エディターの表示リボンにある「パラメータ」の「常に許可」にチェックを入れます。
すると、以下のようにパラメータを参照するアイコンが表示され、パラメータの選択、新規パラメータ作成ができるようになります。
この設定は、オプションと設定から行うこともできます。
2.値の一覧:パラメータをドロップダウンで選択する
※参照:パラメーターのプロパティ
パラメータの値を変更したいとき、候補の一覧から選択できると便利です。それを行うには、パラメータの新規作成で、「提案された値」を「値の一覧」にして、候補となる値をその下に張り付けます。(エクセルからペーストできます)
該当のクエリで、テキストフィルターのステップを追加します。
行のフィルターに、先ほど作ったパラメータを選択します。
Power BIのメニューから「パラメーターの編集」で、先ほど登録した候補が選択できます。
選択を変更した後は、「変更の適用」ボタンが表示されますので、それを押すと、先ほどのパラメータが適用されます。
3.クエリ:候補を別で管理する
パラメータ値の候補を別に持つこともできます。まず、データの入力でテーブルを作成します。
次に「リストに変換」を行います。
先ほどのパラメータの管理で、提案された値に「クエリ」を選択すれば、今作成したリストが選択できます。
以上で、先ほどと同じように、パラメータをドロップダウンで選択できるようになります。
候補を元のテーブルから作成する
元のテーブルのCountryを右クリックし、「新しいクエリとして追加」を行います。
Countryの項目がリストになって作成されますので、重複を削除します。
このリストを、先ほどと同様にパラメータの管理で。クエリに登録します。
元のテーブルのCountry項目のフィルターにこ登録します。
これで、パラメータのリストを手作りしなくて出来上がりました。
テンプレート形式で保存すると、開始時にパラメータ選択ができます
※参照:Deep Dive into Query Parameters and Power BI Templates
このファイルを、Power BIテンプレートファイル(拡張子 .pbit)で保存します。
このテンプレートファイルを開くと、最初にパラメータの選択ダイアログが表示されるようになります。
B.カスタム関数とURLパラメータでWebスクレイピング
※参照:カスタム関数の引数
※ビデオ:Use Power BI Web From Example over multiple URLs
連続したWebページのデータを取得したいとき、1ページづつ取得していくのもいいのですが、もっと簡単に取得する方法が欲しいです。テーブルの値をパラメータにして、関数に渡すことで、URLを書き換えて取得する方法を説明します。
以前書いた記事も参照してください。※Mから始めよう #6 〜Power Queryの関数を作成する
1.注意事項;Webスクレイピングの注意点
今回行う作業はWebスクレイピングという行為で、サイトによっては禁止されていることがあります。利用規約が書かれている場合は、確認してから利用しましょう。
利用規約に書かれている中で、気を付けなければならない点の1つ目は、利用方法についてです。Webで一般公開されているデータを閲覧することに関しての制限はありませんが、利用方法については著作権法による制限が発生することがあります。公開に際しては、データの入手先についての記載を求めているものもあります。また、会員制限定で提供されている情報の場合、許可なく会員外に公開することはできません。その他、音声、映像を違法なサイトからダウンロードすると、処罰の対象となります。
2点目は、アクセス方法です。Webスクレイピングなどの機械的なデータ取得が禁止されている場合があります。高負荷を与えてサービスに支障が出た場合、訴えられる可能性もあります。比較的新しいサーバーの場合、高負荷に耐えることができますが、過信してはいけません。一度に大量のアクセスが発生してDDoS攻撃とみなされないよう、1ページ取得ごとにインターバルを設けるというのが一般的です。
robots.txtを読めという話題もありますが、あれは基本的にGooglebotなどの検索サイトが使っているロボット向けのファイルです。ロボットが広く巡回することは、クローリングと言ってますね。
2.カスタム関数の作成
前置きは以上にして、本題に入ります。今回は、気象庁のホームページから気象情報をダウンロードします。利用規約は、以下の通りになっています。
※気象庁ホームページについて
今回使用する「過去の気象データ検索」は、1月ごとにデータが表示されています。1年のデータを取得するには、これを12回行う必要があります。
(※注)今回は、説明のために月ごとのデータを取得していますが、CSV形式でダウンロードも可能です。データが必要な場合は、ダウンロードサービスをご利用ください。
※過去の気象データ・ダウンロード
最初に、2020年1月のデータを取得し、データを整形して、クエリ名を「長野県上田市」にします。
このクエリを詳細エディタで開き、1行目に引数を指定し、URLの中身を書き換えます。
let
ソース = Web.BrowserContents("https://www.data.jma.go.jp/obd/stats/etrn/view/daily_a1.php?prec_no=48&block_no=0402&year=2020&month=1&day=&view="),
(Year, Month) =>
let
ソース = Web.BrowserContents(
"https://www.data.jma.go.jp/obd/stats/etrn/view/daily_a1.php?prec_no=48&block_no=0402&" &
"year=" & Number.ToText(Year) & "&month=" & Number.ToText(Month) & "&day=&view="),
日付の部分で、年月をリテラルで入力しているので、ここも変えてやります。
追加されたプレフィックス = Table.TransformColumns(置換されたエラー, {{"日", each "2020/1/" & Text.From(_, "ja-JP"), type text}}),
追加されたプレフィックス =
Table.TransformColumns(
置換されたエラー,
{
{"日",
each Number.ToText(Year) & "/" & Number.ToText(Month) & "/" & Text.From(_, "ja-JP"),
type text
}
}
),
これで、クエリは関数に代わり、以下のような画面が表示されます。
年月テーブルの作成
年、月の入ったてーぶろを作成します。最初は、からのクエリから2020年1月のみで作ります。
let
source = Table.FromValue(2020, [DefaultColumnName = "Year"]),
step1 = Table.AddColumn(source, "Month", each {1}),
step2 = Table.ExpandListColumn(step1, "Month")
in
step2
列の追加で「カスタム関数の呼び出し」
列の追加のリボンから、「カスタム関数の呼び出し」を選択し、関数クエリとパラメータを入力します。
以下のように、データがテーブルとして追加されます。
これを、項目名の右の左右に開くボタンを押して、展開します。
以下のようなテーブルが出来上がります。YearとMonthの項目を削除して、年月日を日付、残りを10進数と、型を整えます。
3.遅延の設定
今は、1ページのみの呼び出しでしたが、複数のページを読み込むためには、遅延を設定します。
詳細エディタを開いて以下ように、「呼び出されたカスタム関数」のステップを変更します。遅延は1秒以上入れるのが望ましいので、今回は2秒にしておきました。
let
source = Table.FromValue(2020, [DefaultColumnName = "Year"]),
step1 = Table.AddColumn(source, "Month", each {1}),
step2 = Table.ExpandListColumn(step1, "Month"),
// 変更前
// 呼び出されたカスタム関数 = Table.AddColumn(step2, "長野県上田市", each 長野県上田市([Year], [Month])),
//
// Function.InvokeAfterで、取得間隔を5秒に設定
呼び出されたカスタム関数 =
Table.AddColumn(
step2,
"長野県上田市",
each Function.InvokeAfter(()=> 長野県上田市([Year], [Month]), #duration(0,0,0,2))
),
#"展開された 長野県上田市" = Table.ExpandTableColumn(呼び出されたカスタム関数, "長野県上田市", {"年月日", "降水量(mm)", "最高気温", "最低気温", "降雪(cm)"}, {"年月日", "降水量(mm)", "最高気温", "最低気温", "降雪(cm)"}),
削除された列 = Table.RemoveColumns(#"展開された 長野県上田市",{"Year", "Month"}),
変更された型 = Table.TransformColumnTypes(削除された列,{{"年月日", type date}, {"降水量(mm)", type number}, {"最高気温", type number}, {"最低気温", type number}, {"降雪(cm)", type number}})
in
変更された型
1年分のデータ取得
クエリのステップ1を以下のように変更することで、1年分のデータが取得できます。
step1 = Table.AddColumn(source, "Month", each {1..12}),
以上で2年分のデータが取得できますので、最後にPower BIのレポートでビジュアルを作成します。
C.動的Mクエリ・パラメータ
※参照: Power BI Desktop の動的 M クエリ パラメーター (プレビュー)
※ビデオ:Power BI: Dynamic M query parameters
Power Queryの中で、パラメータを使用してデータを作成するのは、コンテンツの編集権限が必要です。しかし、動的クエリ・パラメータを使用すると、閲覧者がスライサーやフィルターを使用してPower Queryの動作を変えることができます。また、Power Queryでデータをフィルターするので、パフォーマンスの向上が期待できます。
ただし、一般にこの機能が必要なケースはあまりないと思われます。Azure Data Explore、Snowflake、Google BigQueryなどの一部のソースで役に立つと思われます。
動的クエリパラメータを使うには、DirectQueryで接続している必要があります。(サポートされていないDirectQuery接続もあります)加えて、下記のオプションの設定をしなければなりません。
まず、Direct Queryでデータを取得し、パラメータを使った処理を行います。
スライサーとするテーブルを作成します。
Power Queryエディターを閉じるときに以下のような警告が出ます。
スライサーに設定したテーブルの項目を選択肢、プロパティの詳細を開くと、**「パラメーターにバインド」**という項目が表示されます。表示されない場合は、接続がDirect Queryになっているか、オプションのチェックが入っているか確認してください。
**「パラメータにバインド」**の項目に、パラメータの名前を選択すると、また警告が表示されます。
レポートで、スライサーとテーブルを作成します。
スライサーの選択を変更すると、テーブルが変更になります。
複数選択、すべて選択
モデルビューで設定するプロパティで、「パラメーターにバインド」の下に**「複数選択」と「すべて選択」**のスイッチがあります。使用すると、パラメータはリスト形式で渡されますので、Power Queryの式を変更する必要があります。
let
・・・(省略)
フィルターされた行 = Table.SelectRows(削除された他の列, each [crcd9_country] = Country)
in
フィルターされた行
let
・・・(省略)
フィルターされた行 =
if Type.Is(Value.Type(Country), List.Type) then
if (List.Contains(Country, "__SelectAll__")) then // すべて選択
削除された他の列
else // 複数選択
Table.SelectRows(
削除された他の列,
each List.Contains(Country, [crcd9_country])
)
else // 単一選択
Table.SelectRows(
削除された他の列,
each [crcd9_country] = Country
)
in
フィルターされた行
注意事項
※参照:Microsoft Docs 潜在的なセキュリティ リスク、考慮事項と制限事項
- この機能は、現時点でプレビュー中です。Microsoft Docsの注意事項をよく読んでから試用してください。
- この機能を使用すると、インジェクション攻撃のリスクリが生じる可能性があります。
- この機能を使用すると、各種の制限が発生します。