Tableauに関して
ここ最近tableauに関して学ぶ機会があり自分なりに復習できるようまとめてみました。
皆さんのお役に立つことが出来ればと思います!
データ接続に関して
まずtableauでデータを分析するにはデータをどこからか持ってこなくてはいけません。そのためまずはデータを持ってくるようにします。
データを持ってくる方法は大きく二つあります。①ファイルから取得②サーバーから取得です。
①のファイルから取得する方法は自分のパソコンにあるデータを取得することが出来ます。
②のサーバーから取得する方法は下図のようにpostgreSQLやMy SQLはもちろんGoogleスプレッドシートなどからデータを取得することが出来ます。
自分自身で使ってみるとわかるのですが接続する方法はものすごく簡単です。実際に自分で行ってみてください
!
サンプルデータに関して
せっかくtableauを触り始めたんだから、何かしらデータを使用して分析してみたいなーって思いますよね!でも、どんなデータを触って勉強しようかって迷ったりしちゃうこともあると思います。そんな時にものすごく役に立つのがtableauが用意してくれているデータセットです。下の図のようにtableauをダウンロードすると一緒にデータもついてきます。
このサンプル スーパーストア.xlsが分析の練習に適していると思います!
実際に触ってみる。
先ほどのサンプル スーパーストア.xlsに接続したら、下のような画面になります。下の図では注文データを抽出しました。
そしてシート1に移ると下の図のようになります。
左側にはエクセルシートのカラムの名前があり、これらをドラッグして分析を行います。
こんな感じ(売り上げを市区町村ごとに分類し、地域ごとに色分けをしました。)
また元データを見たい場合は、いちいちエクセルシートを見に行かなくても「検索」の隣にあるシートみたいなタブを押せば元データを確認することが出来ます。
ディメンションとメジャーに関して
tableauではディメンションとメジャーというものがあります。赤で囲んだ部分がディメンションになります。ディメンションは赤枠で囲われた部分を見てみるとわかると思うのですがカテゴリデータのようなものになります。そしてメジャーはすべて数値で表されるものになります。
ちなみにオレンジで囲われたところを列シェルフ、水色で囲われたところを行シェルフといいます。
またデータの型に関してなのですが、各ディメンション、メジャーの一番初めにabc,#がついていると思います。それがデータの型をあらわしています。abc:文字列、カレンダーみたいなやつ:日付、#:数値を表しています。
vizの作成
vizとは何かというとtableauで作成した成果物になります。もっと言うと、Tableauで作成したビジュアライズされたグラフや表のことこんな感じです。
ダッシュボードとは
tableauにはダッシュボードというものがあります。これは、これまでに作成したシートを使用して表示するものになります。画面はこのようなものになります。
また上図のように対象のものを選択をすると、対象のもののみ抽出され見やすくなります。今回は事務用品のものをピックアップしました。
また、下の赤丸のところでフィルタリングするとクロス集計表がフィルタ元となりクロス集計表で選択したカテゴリのみ散布図で表示するということもできます。下の図を見てみると、カテゴリが家具である場合、利益と売上は正の相関があるということが理解しやすいと思います。
ファイルの保存
tableauで分析した後は、ファイルを保存したい思います。ファイル形式には大きく二種類に分けられます。
「.twb」はExcelのデータを含まずvizの定義情報のみを保存する際に使用して、「.twbx」はExcelのデータとvizの定義情報の両方を保存する際に使用します。
また二つのファイルのデータを比較するとわかるのですが、twbのほうがサイズは小さいです。
「.twb」はXML形式で書かれたテキストファイルで保存されており、「.twbx」はzipで保存されています。
以上でtableauのほんとーーーーに基本的なところをざっとまとめてみました。散布図や箱ひげ図などといった、おおもとの可視化に関してはまた今度自分なりにまとめてみたいと思います。