はじめに
本記事は、Googleデータアナリティクスのプロフェッショナル認定証のプログラムより、参照させて頂いています。興味を持った方は、是非受講してみてください。
ビジュアライゼーションを作成するための 簡単なルール
聞き手は、自分が見ているものが何なのか、 そのビジュアルを目にして 5 秒以内 に 正確に理解する必要があります。 つまり、ビジュアライゼーションは明確かつ わかりやすいものでなければならないのです。
さらにその 5 秒後 には、 ビジュアライゼーションが示す結論を 聞き手に理解してもらう必要があります。 たとえ彼らが、皆さんの行ってきた研究に 全く精通していなくても、です。 彼らは皆さんの結論に同意してくれないかも しれませんが、それでも構いません。 彼らのフィードバックを得て ビジュアライゼーションを調整し データに戻ってさらに分析することは いつでも可能だからです。
以下はデータビジュアライゼーションを見る側が、作成されたものを評価し、どの程度効果的かを判断するのに役立つ 3 つの質問です。
- 実質的な問いは何か?
- データは何を語っているか?
- ビジュアルは何を語っているか?
ビジュアライゼーション作成に 必要なこと
- データビジュアライゼーションは、 小さなスペースに 多くの情報を収めるのに役立つツールです。 そのためには、まず思考を構造化し 整理する必要があります。 そもそもの目的と あなたがデータを並べ替えて出した結論について 考えてみてください。
- 次に、 データから気づいたパターンや意外だったこと、 そしてもちろん、それらすべてがあなたの分析に どう関わってくるかを考えます。 このように、分析結果の重要な要素を 明らかにすることで プレゼンテーションを どのように構成すべきかが決まります。
4 つの重要な要素
これは、David McCandless 氏が作成した データビジュアライゼーションです。
このグラフィックには、
- 情報またはデータ: データビジュアライゼーションには、伝えたい情報やデータが重要です。情報やデータがなければ、調査結果をうまく伝えることはできません。
- ストーリー: ストーリーによって、データを有意義かつ興味深い方法で共有できます。ストーリーがなければ、ビジュアライゼーションは情報にはなっても、実際に感動を与えるものにはなりません。
- ゴール: データビジュアライゼーションのゴールは、ビジュアライゼーションを用いて、データを有用で利用しやすいものにすることです。ゴールがなければ、たとえビジュアライゼーションが有益であっても、実用的なインサイトを導き出すことはできません。
- ビジュアルフォーム: ビジュアルフォームの要素は、データビジュアライゼーションを構造的に整え、美しくします。ビジュアルフォームがないと、データはビジュアライゼーションされません。
の 4 つの重要な要素が含まれています。
ビジュアライゼーションは 4 つすべての要素を意味のある形で 組み合わせてこそ、 真にパワフルで効果的なものになります。 これらすべての要素を合わせることで、 聞き手にとって意義深いものが作れるのです。
Google では、 データに関するストーリーを伝えるため これら 4 つの要素すべてを含む ビジュアライゼーションを心掛けています
2 つのデータ ビジュアライゼーションの例
- 情報 (データ): このビジュアライゼーションでは、NASA や気候変動に関する政府間パネルなど、さまざまな情報源から入手した海面上昇に関する気候データを使用しています。また、そのデータに加えて、世界中の海面水位の記録を使用し、海面上昇が世界に与える影響を説明しています。
- ストーリー: このビジュアライゼーションは、非常に明確なストーリーを語っています。8,000 年の間に、私たちが知っている世界の大部分は水没してしまうのです。
- ゴール: このプロジェクトのゴールは、海面上昇によって地球規模でどれだけの影響が出るかを示すことです。データとビジュアルの両方を用いることで、このビジュアライゼーションは、海面上昇をより現実的なものとして感じさせます。
- ビジュアルフォーム: このビジュアライゼーションでは、都市のシルエットが、ビジュアライゼーションのポイントを美しく強調しています。海面上昇によって周囲の世界にどのような影響が及ぶかを、見る者に数字だけでは表現できないような形で暗に示しています。また、このビジュアライゼーションでは、よりグローバルな視点を持たせるために、地図も挿入しています。
- 情報: データを表示すると、ビジュアライゼーションで示されている測定指標を探索できます。
- ストーリー: このビジュアライゼーションでは、どの犬が過大評価され(overrated)、どの犬が注目されていないか(rightly ignored)、そして、どの犬が実際に人気なのか(hot dogs!)などがわかり、これまで知らなかった、見過ごされていた貴重な情報に触れることができます。
- ゴール: このビジュアライゼーションでは、さまざまな犬種について、人気度と客観的なデータスコアとの関係を探ることに焦点を当てています。これらのデータポイントを比較することで、それぞれの犬種がどのように認識されているかをより詳しく知ることができます。
- ビジュアルフォーム : このビジュアライゼーションでは、4 マスの構造に加えて、データセットに関する情報を伝えるために他の視覚的な目印も使われています。データポイントは犬のマークで表現されており、犬のシンボルのサイズと向きによってデータに関する他の詳細も伝えられています。
優れたビジュアライゼーション
データ ビジュアライゼーションを 作成する際に 最も考慮すべきことの 1 つは
「聞き手にどこに注目してもらいたいか」
です。
- あまりに多くのデータを見せすぎると 聞き手はどこを見れば良いか混乱します。 場合によっては、データを絞り込むことも 有効な手段です。
- 一方、表示するデータが少なすぎても ビジュアライゼーションが不明瞭になり 意味がなくなります。
一般的なルールとして 混乱を招かない範囲で 聞き手が調査結果を理解するために 必要なデータのみを ビジュアライゼーションで表すべきです。
相関関係と因果性
- 相関関係 とは、2 つの変数が互いにどの程度の関連性を持って動くかの度合いを表す指標です。相関関係を表す例として、「気温が上がると、アイスクリームの売れ行きも上がる」という考え方があります。ここで重要なのは、相関関係はある事象が別の事象を引き起こすというわけではないということです。つまり、その事象がお互いにパターンを持っている、あるいは関係性を持っているということなのです。もし、ある変数が上昇し、他の変数も上昇すれば、それは正の相関関係といえます。一方の変数が上昇し、他方の変数が下降する場合、それは負の相関関係、または逆相関の関係にあるといえます。一方の変数が上昇し、他方の変数がほぼ同じであれば、相関関係はないといえるでしょう。
- 因果性とは、ある事象が特定の結果につながるという考え方です。因果関係など、行動が直接結果に結びつくことを指します。例えばカミナリが落ちると、落雷による空気の加熱・冷却でカミナリ(音波)が聞こえます。つまり「落雷があるからカミナリが聞こえる」のです。
データ分析から結論を出す時には、データ同士に相関関係があるだけで、因果性があると判断しないように注意しましょう。
例えば、外の気温が上がり、アイスクリームの消費量も増えた場合、「暑いからアイスクリームを食べるようになった」と結論づけたくなるかもしれません。しかし、データを詳しく調べると、気温の変化だけがアイスクリームの消費量に影響するわけではないことがわかります。データ収集期間にアイスクリームのセールがあったとしても、それは分析では考慮されていない可能性があります。
データ分析では以下のことを忘れないようにしましょう。
- 見つけた相関関係を精査する。
- データのコンテキストを調べ、因果性が妥当かどうか(すべてのデータによって裏付けられるかどうか)を判断する。
- 分析に使用するツールの制約を理解しておく。
ダイナミック ビジュアライゼーション
-
スタティック ビジュアライゼーション とは 編集しない限り、時間の経過とともに 変化しないものを表します。 これは、データとデータにまつわるストーリーを 管理したい場合に有効です。
- 紙に印刷されたビジュアライゼーション
- 表計算ソフトで作成されたグラフ
-
ダイナミックビジュアライゼーション は インタラクティブで、 時間とともに変化するものです。 これらのグラフィックは インタラクティブであるため ユーザー側で見るものを ある程度コントロールできます。 これは、ステークホルダーの要望に応じて 表示する内容を調整するのに役立ちます。
- Tableau
Tableau
Tableau とは、データを見て理解し 意思決定することを支援する ビジネス インテリジェンスおよび アナリティクス プラットフォームです。 Tableau のビジュアライゼーションは 自動的にインタラクティブなものになります。
下図は、ダッシュボードに入って 2015 年から 2017 年にかけて 幸福度のスコアがどう変化したかのものです。
- 左側は、各国レベルでの 幸福度スコアの変化を示しています。 各国の幸福度は、上昇幅が大きい順に 並べ替えてあります。
- 右側には、幸福度スコアで 色分けされた地図があります。 幸福度が最も高い国は青で、 最も低い国は赤で 表示されています。
地図の下には どの年の幸福度を地図上に表示するか 選ぶことができる 「表示年」スライダーがあります。 現在は 2016 年になっていますが 2015 年や 2017 年のスコアが知りたければ スライダーで調整します。