#はじめに
Tableauでもっと良いVIZが作りたい、でもそもそも良いVIZ・悪いVIZってなに?
という疑問を抱えていた私でしたが、
Tableauが公式で公開しているホワイトペーパーと、Tableau Jedi KTさんの動画で大分この点についての理解が深まりました。
見せ方のテクニックについてかなり細かく解説されているので、以下に当てはまる方には是非お勧めしたいです。
・私と同じように「そもそも良いVIZ・悪いVIZってなに?」という疑問を持っている方
・「良いVIZ」から「素晴らしいVIZ」にステップアップしたい方
・ビジュアライズのテクニックを抑えたい方
良いVIZ・素晴らしいVIZの解釈が気になる方はOPEN
良いVIZ:分析者(viewer)が求める要件が満たされている依頼内容に沿ったVIZ
素晴らしいVIZ:分析者(viewer)が求める要件が満たされている依頼内容に沿ったVIZであり、データについてより深くより迅速に理解できる
↓↓↓そんな方に是非読んで欲しいリンクはこちら↓↓↓
■視覚的分析のベストプラクティス: ガイドブック
■効果的なダッシュボードを作成するための 10 のベストプラクティス
■ビジュアル分析のサイクル
■[Visual Best Practice: Art and Science of Visual Analytics](https://www.youtube.com/watch?v=_flMp3iD8z4 "Tableau Jedi KTさんの動画")
■[Vizの評価は何で決まる? Analytics/Design/Storytelling](https://www.youtube.com/watch?v=mLONL_NcgIM "Tableau Jedi KTさんの動画")
※追記するかも
そして今回私の投稿では上記の情報を元に理解をまとめてみました。
私の中の気付きとして、大きく分けると以下二つ。
①VIZ作りの流れを理解する
②脳の理論を理解する
ここを押さえるだけでぐっと変わると思います。
興味がある方は是非読んでみてください。
今回は①VIZ作りの流れを理解するのまとめになります。(②は次回の投稿で)
#VIZ作りの流れを理解する
まずはVIZ作りの大まかな流れは以下になります。
①質問から始める
②正しいグラフタイプの選択
③効果的なビューの作成
④総合的なダッシュボードの設計
⑤作品の完成
⑥作品の評価
それではそれぞれの工程を細かく確認していきましょう。
##①質問から始める
ダッシュボード作成の際に一番大事になるところです。
その為、冒頭でご紹介した解説リンクでも、この工程についてはかなり触れられている事が多いです。
曖昧な状態でダッシュボード作成を進めると後から苦労するのは自分なので、まずはここをしっかり押さえなくてはいけないところ。
ではどんな質問(理解)が必要なのかというとまずは以下を確認してみましょう。
・分析者(viewer)は誰か?
・分析者(viewer)がダッシュボードを通して分析したい事は何か?
・分析したい内容に当てはまる正しい分析タイプ(グラフ)は何か?
・自分のビジュアライゼーションから他にどのような疑問・問題が生じるのか、あるいはどのようなディスカッションが生まれる可能性があるか?(ここで新しいアイデア、より良い施策が生まれることがある)
ここで気を付けなければいけないのは作成する側(creator)は「何が欲しい?」という質問はしないように気を付けましょう。
なぜならば、人は知らないことをオーダーする事が出来ないからです。(こちらはKTさんのチャンネルで教えて頂きハッとしました)
また、対象ユーザーの専門知識のレベルを知ることも重要です。
たとえば、対象ユーザーが初心者(Tableauを触り慣れていない人)にはフィルターやパラメーターに、ラベリングを追加するなど考慮すると良いです。
##②正しいグラフタイプの選択
目的が定まったら、次はその目的に適したグラフを選びます。
ちなみに私は少し前まで、クロス集計ばかりを使っていました。
理由としては折れ線グラフや棒グラフなど、分析ごとの適切な表現方法を把握出来ていなかった為クロス集計を多用してました(恥
分析タイプごとの適したグラフをご紹介します。
###経時的な傾向
データの分析の中でも必要とされることが多い、経時的な傾向の分析の場合には
折れ線グラフ、面グラフ、棒グラフの3つが活用されることが多いです。
どのような違いがあるのかそれぞれのタイプごとに見ていきましょう。
■折れ線グラフ
カテゴリ同士の比較やカテゴリごとの傾向を分析することができます。
しかしながら全体的な傾向はわからない
続いて棒グラフ・面グラフを続けて見てみます。
先ほどの折れ線グラフとは異なり、まず全体的な傾向を見ることができます。
それに加えて、各カテゴリの貢献度も見ることができます。
どちらも優れていますが、違いとしては面グラフは各カテゴリを 1 つのパターンとし、棒グラフでは各月を 1つのパターンとしています。
###比較とランク付け
例えば国や地域、事業区分、営業担当者などを1つまたは複数の条件に基づいて比較したりランク付けすることがあります。
そのような場合には棒グラフを活用することで、1つのベースライン上で長さを表現することができ、比較とランク付けに適しています。
###相関性
メジャー同士の関係性を分析したい場合には、相関性の分析を行う必要があります。
相関性の分析で使えるグラフを見ていきましょう。
■散布図
散布図を活用することで、メジャー同士の関係性を分析できます。
上記のグラフでは散布図を通して、カテゴリごとの売上と利益の傾向を見ることができます。
※ただし、相関性は必ずしも関係性を保証するものではなく可能性を示唆する程度に捉えた方が良いです。
立証するには、より洗練された手法が必要になることがあるので活用する場合には要注意です。
■折れ線グラフと棒グラフを組み合わせ
折れ線グラフと棒グラフを組み合わせで相関性を見ることもできます。
上記のグラフでは、売上を折れ線グラフで、数量を棒グラフで表示することで、分析者(viewer)が2つの傾向の比較に注目することが出来ます。
###分布
分布の分析はデータ分析の中でも特に役立ちます。
すべての定量的範囲にわたって定量値がどのように分布しているかが分析できます。
目的別の分布の分析タイプを見ていきましょう。
■箱髭図
箱髭図は複数の分布を表示するのに優れています。
上記のグラフではサブカテゴリ別の平均割引率が、メーカーによってどれだけ変化があるかが見れます。
そもそも箱髭図の見方が分からない・・・という方は以下を参考にしてください。
(実は私も最近になって箱髭図を知りました)
<箱髭図の見方>
■ヒストグラム
分布を分析するもう 1 つの方法はヒストグラムです。
上記のグラフでは利益が0円から5,000円以下の注文が最も多く、全体の58%をしめていることが分かります。
データをビン(価格)で分けてその区分ごとの数(注文数)を記載しています。
つまりヒストグラムでは、ピークの値はどこなのか・ピークの値が全体のどれだけをしめているのかということが分析できるのです。
さらにカテゴリごとに色分けし、細かい割合を見ることもできます。
###一部と全体との関係
一部と全体の間の関係を分析する場合には、よく円グラフが使われます。
私もグラフの中でも見慣れているのが特に円グラフでした。
しかしながら円グラフには以下のデメリットがあります。
・隣り合っているものしか比較できない
・角度を比較するのが困難
・色を使わないと表現できない
・スペースを大幅に取る
・数が多いものを比較することができない
では棒グラフにするとどうでしょうか。
■棒グラフ
こちらは円グラフと同じデータを、合計に対する割合で示した棒グラフです。
色がないとやはり比較が難しく、比較対象の数が多い場合には見辛いですが、棒グラフでは各年ごとの比較に優れているので、そういった意味では円グラフよりは比較し易いです。
比較対象が多い場合にはやはり分析は見辛くなってくるというのが付きものです。
###地理的データ
地理的データの分析ではマップが活用されます。
■マップ
上記のマップは、利益が赤字の都道府県に色を付けたシンプルなものになります。
マップ情報を示したうえで、更に棒グラフ・折れ線グラフ・クロス集計などを組み込んだテクニカルなグラフは最良の資料になります。
##③効果的なビューの作成
ビュー作成時の5つのポイント
■最重要データの強調
複数のメジャー・ディメンションを1つのビューで表示する際、分析内容や目的によって強調する箇所を考える必要があります。
最も重要なデータを X 軸と Y 軸に設定し、さほど重要でないデータを色やサイズや形状に設定し見せるのが一般的です。
■読みやすいビューの作成
人間の脳は文字が縦向きでも横向きでも読むことが出来ますが、無駄に脳を使わせることは良いビジュアライゼーションとは言えません。
ラベルに単語や値が入る場合は、文字が横向きに表示されるようにビューを回転させるのが良いです。
以下のビューを参考に見てみましょう。
項目名と売上数が横向きになっています。これでも読めるものの、やはり少し違和感ありませんか。
以下の赤枠を押下することで行と列の交換を簡単に入れ替えできます。
これで大体いい感じなのですが、ビューが入り切っていないのが気になります。
以下の赤枠プルダウンで「高さを合わせる」を選択します。
今回の場合は文字サイズが若干小さくなりますが、カーソルを操作しなくてもビューが入り切っているのでこれでOKです。
(※更に表示項目数が多い時などは、更に考慮が必要になりますが参考までに)
回転した際、横長になってしまう為、横幅がビュー内に収まるように調整してみます。
その結果、値は文字数がオーバーし強制的に縦持ちに、都道府県名はぱっと見収まっているように見えますが和歌山や北海道が見切れています。
よって今回は前者の方法が適切という結論になります。
■ビューの整理
横方向の棒グラフが2つ横に並んでいる場合、比較がし辛くなっている可能性があります。
その場合にはブレットグラフを活用しましょう。
このグラフは棒グラフに参照線を組み合わせることで、実際の数と目標の数を視覚的に比較できるようになります。
(ノルマや目標を達成しているかどうか?を分析する場合にも役立つグラフです)
※赤線が前年を示している。赤線を超えていれば一目で前年比達成を見ることが出来る。
■ビューへの過重な負荷の回避
数多くのメジャーとディメンションを1つのビューの重ねて表示すると、ビューに過重に負荷をかけてしまうので複数のグラフに分割すると良いです。
■1つのビューで使用する色と形状の数を制限
色と形状の数は7~10種類に制限すると良いです。
##④総合的なダッシュボードの設計
使いやすいダッシュボードを作成するためのポイント
■最も重要なビューをダッシュボードの上部もしくは左上端に配置
ダッシュボードを表示したときにまず目にするのがその場所だからです。
■フィルターが連鎖式のインタラクティビティを採用している場合は、上から下、および左から右に構成
連鎖式のインタラクティビティとはビジュアライゼーションの中で、1 つのビューが次のビューをフィルターする機能のこと。
その結果、フィルターされた最後のビューが一番下もしくは右下端に配置されます。
■ダッシュボードに配置するビューの数は、大きな必要性がない限り 3 つもしくは 4 つまでに限定する
ビューの数が多すぎると全体像がぼやけてしまうことがあります。
そのようなときはダッシュボードの数を増やせばいい(無理に一つのダッシュボードにまとめないこと)
■1 つのダッシュボードで複数のカラー スキームを使用することは避ける
それでもセンスよくまとまっている時は問題ないが、慣れないうちは万人が見やすい使いやすさを重視します。
■フィルターが複数ある場合はレイアウト コンテナーでまとめる
すると境界線で囲まれるため、それらに共通の特徴があるというわずかな視覚キューをもたらします。
フィルターを配置する場所は、ダッシュボードの右側、上側、左側が適しています。
■凡例がすべてのビューに適用される場合は、すべてのフィルターと一緒に配置
凡例がビューの一部に適用される場合は、できるだけそのビューに近い所に配置します。
##⑤作品の完成
色
・使用するカラー パレットは 2 つまでとする
・タイトルの背景色をグレーや白、もしくは他のスキームと衝突しない明るい色に変更してみるとよい
・多くの文化では、緑はポジティブ、赤はネガティブを暗示(赤字は赤)
フォント
・専門家が読みやすいとするフォントは以下
Trebuchet MS or Verdana
Arial
Georgia
Times New Roman
Lucida sans
・1つのビューに使用するフォントの色は2・3種類が良い
・隣り合うテキストは複数の属性を避ける(サイズ・文字・色・文字のひげ飾りなど変更を避ける)
ツールヒント
・メジャー名を具体的でわかりやすいものに変更
・ツールヒントに表示するすべての数値には必ず単位を付ける
インテリジェントな軸の作成
・以下の軸機能の詳細を理解し活用する
固定軸: 軸を特定の固定範囲に設定する
軸のグリッド線:データの範囲がとても広い場合など、固定の軸を作成することが現実的ではない場合は、ビューにグリッド線を活用する
軸のラベル:軸のラベルが適切であることを確認し、必要に応じて単位を加える
軸の目盛ラベル:: 目盛の値も正しく書式設定されていることを確認ずる
ラベル付け
・以下のラベルタイプを理解し、主題を簡単かつ簡潔に伝えるために活用する
選択項目にラベル
最小値と最大値にラベル
ハイライトにラベル
行末にラベル
行末にラベルが個人的に少し分かり辛かったので補足します。
ディメンションに日付がある際に表示される、「最新」を選択し、スコープを選択すると最新(行末)に値が入ります。
※ちなみに「終点」は最古と最新に値が入るものでした。
ディメンションに日付がない場合には以下のように「最新」は表示されません。
##⑥作品の評価
一歩下がり、客観的に見直して自分のVIZを評価します。
評価の観点は、ホワイトペーパーにチェックリストが記載されているので参考にすると良いです。
また、VIZを実際に対象ユーザーに利用頂いた後に、アンケートなど意見を伺うのもいいと思います。
長くなりましたが、以上になります。
次回の投稿は後半の、脳の理論を理解するについて投稿します。
最後に。
リリースした後のダッシュボードを分析に活用する→振り返る→改善(繰り返し)というサイクルが出来たらベスト。
これが出来たらもっと分析者(viewer)も作成者(creator)も成長できそうですよね。もっと良いアイデアが浮かぶのかも。
良いダッシュボードとは、作って終わりではなく分析者(viewer)と作成者(creator)のコミュニケーションで成長していくものだと思うので、今後自分の中で重要視したい課題です。