最近、AWSとセットで導入されるBIツール「Tableau」について、基本的な使い方をまとめてみました。「Tableau」は非常に簡単なツールなので、エクセルを使える人なら簡単にデータを可視化することができます。
2019年8月3日追加 情報を一部アップデートし、再編集したものを自身のブログに公開しました。こちらをご覧ください。
https://tadaken3.hatenablog.jp/entry/tableau-map
「Tableau」については以下のサイトもご覧ください。
今回は無料で使えるtableau Publicを使用しています。製品版のtableau Desktopと機能的にはほとんど、変わりません。DLサイトはこちら↓
https://public.tableau.com/s/
データの準備
PythonのPandasモジュールを使用して、
Wikipediaの「都道府県別の人口一覧」ページからデータを取得しています。
(tableau publicだと、テキストファイルしか扱えないため、CSVファイルを出力しています。
製品版だと、DBから直接データを取得することができます)
tableau10.0からtableau publicがGoogleスプレッドシートとWebデータコネクタに対応しました。
しかも、Googleスプレッドシートが更新されると日時処理で自動更新されます。tableau public始まりすぎ。(追記:2016-10−05)
import pandas as pd
url = 'https://ja.wikipedia.org/wiki/%E9%83%BD%E9%81%93%E5%BA%9C%E7%9C%8C%E3%81%AE%E4%BA%BA%E5%8F%A3%E4%B8%80%E8%A6%A7'
fetched_dataframes = pd.read_html(url, header = 0)
df = fetched_dataframes[0]
df.to_csv("population.csv", index = False,encoding='utf-8')
データの読み込み
tableau publicを立ち上げて、さきほどのCSVファイルを読み込みます。とくに設定などは必要ありません。(population.csvというファイルです)
データの可視化
今回は、都道府県ごとの人口増減率を算出し、それを地図上に可視化したいと思います。まず、人口増減率の計算をしていきます。エクセルのような感じで、計算式を入れていきます。今回は使用していませんが、ひととおり関数も用意されており、ほんとうにエクセルみたいに簡単に計算できます。
今回は地図を使用したいため、ディメンジョン「都道府県」に「地理的役割」を指定します。米国のツールなので、「州」になっていますが、こちらを指定すると日本の都道府県をきちんと認識してくれます。
都道府県をダブルクリックすると、「Tableau」が自動で認識して、最適なビジュアル表現を選んでくれます。今回の場合、地理的情報を設定しているので、地図が表示されます。(もちろん、自分で設定することもできます。)今回は人口増減率で色で表現したいと思うので、マークの箇所に先ほど作成した「人口増減率」のメジャーを入れます。
「人口増減率」を選択して「色」を指定します。
すると、人口増減率で各都道府県が色分けされます。
関東以外、ほとんど真っ赤ですね。
あとは、書式やコメントなどで補足してあげると完成です。完成したファイルは、tableau publlicの公式サイトにアップロードし公開することができます。こんな感じです。