LoginSignup
2
3

More than 5 years have passed since last update.

Cortana Intelligence Suiteを構築(第3回)- 新AzureポータルからのStream Analyticsの使い方(応用編)

Posted at

この記事で試すこと

Azure Event Hubsへ大量のデータを受信できますが、その後の加工処理をリアルタイムで行いたい場合に便利なのが、この「Azure Stream Analytics」です。この記事では、そんな「Stream Analytics」を利用して、データをすぐにリアルタイムで視覚化できる、Power BIへの設定方法をご紹介します。
まだAzure Event Hubsを設定されていない場合は、こちらからWeb APIを利用したEvent Hubsの設定方法がご覧頂けます。

事前に準備するもの

  • Azure サブスクリプション
  • Power BI サブスクリプション(無料版、Pro版のどちらも可能です)
  • オープンデータへのアクセス権限(権限が必要な場合)

設定手順

Azure Stream AnalyticsからPower BI出力を設定する

Azure Stream Analyticsを利用することで、リアルタイムでイベントデータをそのままPower BIへ出力をすることも出来ます。Power BIの無料バージョン、Power BI Proの両方のバージョンで利用可能な機能です。
これは、2016年4月16日に一般公開されました(https://azure.microsoft.com/en-us/blog/streamanalytics-and-powerbi/)

始める前に

Power BIへ出力するには、事前にPower BIへサインアップしておく必要があります。
Azureと同じアカウントである必要はありません。
サインアップされていない場合は、https://powerbi.microsoft.com/ja-jp/get-started/ からサインアップしてください。

手順

  1. まず、ストレージアカウントへの送信同様、「出力」をクリックします。
    image

  2. 「シンク」は「Power BI」を選択します。
    image

  3. 「接続の承認」
    image

  4. Power BIのアカウントでログインします。
    image

  5. ログインされると、「データセット名」と「テーブル名」が表示されます。
    image
    以下のように、データセット名(左下)とフィールド(右側)に反映されるイメージです。
    image

  6. 正しく設定されると、以下のような通知が表示されます。
    image

  7. これでPower BIへの出力設定は完了です。
    image

クエリを設定する

  1. 「クエリ」をクリックします。
    image

  2. ストレージアカウントアカウント用のクエリの下に、更にクエリを追記し、画面左上の「保存」をクリックします。
    image

このクエリの例は、東京メトロのオープンデータAPIを利用しています。
元々の列名には「:」が含まれているため、よりわかりやすい列名に変更しました。
また、「dc:date」の列を元に、月、日、時間、分の専用の列を追加しています。追加することで、時間別や、月別、週別などの集計がよりPower BI上でやりやすくなります。

  1. 正しく設定されていれば、以下のように通知されます。
    image

  2. 「開始」をクリックすると、Stream Analyticsが開始され、受信したイベント(ここではEvent Hubsからのデータ)が設定したクエリ処理を経由して、出力先に送信されます。
    image

  3. 開始されると、以下のように入出力の件数が表示されます。
    image

Power BIで確認する

  1. Power BIへログインすると、新たなデータセットが画面左下に追加されていることが確認できます。クリックすると、画面右側にフィールドとして、Azure Stream Analyticsで事前にクエリ内で指定していた列名が表示されます。
    image

  2. 私の例では東京メトロの運行状況なので、「delay」という列が、遅延時間を表しています。この「delay」の列をクリックしながら、空白のエリアへドラッグしてみます。

  3. 自動的にPower BIがdelayの列でグラフを作ってくれました。折れ線グラフにし、軸へは「date」をドラッグしてきます。
    image

  4. そうすると時系列的に遅延時間の推移が表示されるようになりましたね。
    image

  5. 少しシンプルですが、これでレポートを保存してみましょう。
    image

  6. そのままこのグラフを「ピン止め」することで、ダッシュボードを作成できます。
    image

  7. 新しいダッシュボードを選択し、ダッシュボード名を指定したあと、「ピン留め」をクリックします。
    image

  8. これでピン留め完了です。
    image

  9. ダッシュボードでは、リアルタイムでStream Analyticsのデータを表示してくれます。レポートでは更新を押す必要がありましたので、便利ですね。
    image

  10. 手をもう少し加えると、以下のようなリアルタイム運行状況ダッシュボードが作成できました!
    ※ちなみに、2016年10月1日から3日の間では、千代田線の北千住駅が一番遅延していた結果となりました。
    image

次回の投稿では静的データをData Factoryを使って管理していこうと思います。お楽しみに!

リンク集

著者が作成する際に、参考にしたリンクです:
https://azure.microsoft.com/en-us/documentation/articles/stream-analytics-power-bi-dashboard/

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3