Tableauの基礎の基礎(地理情報を使ったビジュアライズ)

最近、AWSとセットで導入されるBIツール「Tableau」について、基本的な使い方をまとめてみました。「Tableau」は非常に簡単なツールなので、エクセルを使える人なら簡単にデータを可視化することができます。「Tableau」については以下のサイトもご覧ください。

今回は無料で使えるtableau Publicを使用しています。製品版のtableau Desktopと機能的にはほとんど、変わりません。DLサイトはこちら↓

https://public.tableau.com/s/


データの準備

PythonのPandasモジュールを使用して、

Wikipediaの「都道府県別の人口一覧」ページからデータを取得しています。

(tableau publicだと、テキストファイルしか扱えないため、CSVファイルを出力しています。

 製品版だと、DBから直接データを取得することができます)

tableau10.0からtableau publicがGoogleスプレッドシートとWebデータコネクタに対応しました。

しかも、Googleスプレッドシートが更新されると日時処理で自動更新されます。tableau public始まりすぎ。(追記:2016-10−05)

import pandas as pd

url = 'https://ja.wikipedia.org/wiki/%E9%83%BD%E9%81%93%E5%BA%9C%E7%9C%8C%E3%81%AE%E4%BA%BA%E5%8F%A3%E4%B8%80%E8%A6%A7'
fetched_dataframes = pd.read_html(url, header = 0)
df = fetched_dataframes[0]
df.to_csv("population.csv", index = False,encoding='utf-8')


データの読み込み

tableau publicを立ち上げて、さきほどのCSVファイルを読み込みます。とくに設定などは必要ありません。(population.csvというファイルです)

スクリーンショット 2015-11-26 22.49.48.png


データの可視化

今回は、都道府県ごとの人口増減率を算出し、それを地図上に可視化したいと思います。まず、人口増減率の計算をしていきます。エクセルのような感じで、計算式を入れていきます。今回は使用していませんが、ひととおり関数も用意されており、ほんとうにエクセルみたいに簡単に計算できます。

スクリーンショット 2015-11-26 22.22.45.png

今回は地図を使用したいため、ディメンジョン「都道府県」に「地理的役割」を指定します。米国のツールなので、「州」になっていますが、こちらを指定すると日本の都道府県をきちんと認識してくれます。

スクリーンショット 2015-11-26 22.21.35.png

都道府県をダブルクリックすると、「Tableau」が自動で認識して、最適なビジュアル表現を選んでくれます。今回の場合、地理的情報を設定しているので、地図が表示されます。(もちろん、自分で設定することもできます。)今回は人口増減率で色で表現したいと思うので、マークの箇所に先ほど作成した「人口増減率」のメジャーを入れます。

スクリーンショット 2015-11-26 22.23.42.png

「人口増減率」を選択して「色」を指定します。

スクリーンショット 2015-11-26 22.23.51.png

すると、人口増減率で各都道府県が色分けされます。

関東以外、ほとんど真っ赤ですね。

スクリーンショット 2015-11-26 23.09.00.png

あとは、書式やコメントなどで補足してあげると完成です。完成したファイルは、tableau publlicの公式サイトにアップロードし公開することができます。こんな感じです。

都道府県別の人口増減率.png