#Microsoft Power BI Desktop と Cognitive Services による Twitter テキスト分析レポート(3)
第1回 では Microsoft Flow を利用して、キーワードによる Twitter 検索データを Excel ファイルに自動抽出&保存を行い、第2回 では Microsoft Power BI Desktop にデータを取り込んで、Microsoft Cognitive Services の Text Analytics API を利用して、Tweet テキストのネガポジ分析を行い、データの編集加工を行いました。
今回は、Power BI Desktop で編集加工済みのデータを用いて、各種グラフや地図、ワードクラウドによるレポートを作成します。
##手順
0.準備
- Flow で Twitter キーワード検索データを OneDrive 上の Excel に保存するフローを作成
- Power BI Desktop & Cognitive Services で Twitter テキストデータを分析
- 取得&分析した Twitter テキストデータを Power BI Desktop でグラフィカルに表示
#3. 取得&分析した Twitter テキストデータを Power BI Desktop でグラフィカルに表示
Power BI Desktop でクエリからデータを取り込んだ状態から、以下のようなレポートを作成していきます。
##3.1 グラフや地図を利用したレポートの作成
Tweet 総数 と ユニークユーザー数 を表示するには、ビジュアルテンプレートの "カード"を使用します。[視覚化]ツールバーにある [カード] をクリックします。
[フィールド]ツールバーから [TweetStreamSentiment]>[tweet_id] を選択して、[フィールド]ツールバーに表示されている [フィールド] の欄にドロップします。
[フィールド] の欄にドロップされると [tweet_id のカウント] と表示されます。"カウント" になっていない場合は、右端をクリックして [カウント] を選択します。
同様に、再度 [カード] をクリックして、[TweetStreamSentiment]>[user_id] を配置します。[user_id のカウント] の欄の右端をクリックして、今度は [カウント(一意の値のみ)] を選択します。
Tweet テキストのネガポジ分析値を表示するには、"円グラフ" と "ゲージ" を使用します。
円グラフでは "score(round)" (小数点第1位を四捨五入) の値を使用し、0.1 刻みでの分布を表示します。"score(round)"の値に合わせてデータの色を変更し、1(赤)~0(青)をグラデーションで設定します。
ゲージでは "score" (丸めなし) の値を使用し、平均値を表示します。ゲージ目盛の表示に最大値と最小値を利用しています。
地図では、"geo" と "score(round)" を使用して、Tweet された場所を表示します。円グラフと同様に、"score(round)" の値に合わせてデータの色を変更しておきます。
時間データを抽出できている場合は、"集合縦棒グラフ" を使用して、時間ごとの Tweet 数を表示します。また、"折れ線グラフ" を使用して、時間ごとの Tweet の分析スコア値の平均を表示します。
##3.2 ワードクラウドを利用したレポートの作成
カスタムテンプレートを利用すると、デフォルトで用意されている以外のビジュアルを利用することができます。ここでは "ワードクラウド" のテンプレートを利用して、Tweet テキストに含まれる言葉を抽出し、文字のサイズでカウントを表現します。
Power BI の "ワードクラウド" テンプレートをダウンロードします。
https://app.powerbi.com/visuals/show/WordCloud1447959067750?WT.mc_id=Blog_Visuals
[視覚化] ツールバー の […] をクリックして [カスタム ビジュアルのインポート] を選択し、ダウンロードしたテンプレートを読み込みます。
[Category] に [TweetStreamSentiment]>[text] をドロップすると、テキスト分析が行われます(少し時間がかかります)。分析が終了すると、タグクラウドが表示されます。
以上で Twitter テキスト分析レポート シリーズは一旦終了です。