はじめに
Google流資料作成術という本を最近読みまして、データ分析の可視化(データビジュアライゼーション)に関して新たな知見が得られたのと同時に自分なりの意見を持ちましたので、今回それを綴ります。
主張: 円グラフは使うべきでない
P63からP66にて、円グラフの利用は極力控えるべきと、本の著者コール氏は主張していました。
また、円グラフの代替案としては以下の4つが提唱されていました。(P249~P249のケーススタディにて記載)
- 直接数字を見せる
- 縦棒グラフを使う
- 100%積み上げ横棒グラフを使う
- スロープグラフを使う
私的にも、2.と3.の縦棒グラフと100%積み上げ横棒グラフで円グラフを代替するというのがけっこうしっくりきて、実際に円グラフで描画したときよりも見やすくなるなと感じました。
円グラフは使うべきでない理由
円グラフは使うべきでない理由ですが、著者は「円グラフでは、要素の大小関係がわかりずらい」と述べていました。
これに対して、私も賛成です。具体的な事例な事例として、実際に同じデータビジュアライゼーションの事例を用いて円グラフと積み上げ棒グラフとで比較してみます。
具体的な事例
例えば、「大谷翔平選手の変化球の投球割合が一番多いのはスイーパーである」と主張したい場合があるとします。
その際に、円グラフで描画する場合と横棒グラフを使って描画する場合に分けて見比べてみます。
まずは、以下に2023年の大谷翔平選手の変化球の投球割合を円グラフで示します。
上記の円グラフで描画した場合、以下のようなことを思うのではないでしょうか。
- 「投球割合が一番多いのはスイーパーである」という主張について、2番目に投球割合が多いストレートよりとそんなに変わらないんじゃないかな?(定量的な違いがグラフから読み取りにくい)
- 各要素(変化球)の割合がどれくらいなのかわからない。
次に、以下のように横棒グラフにして描画を行いました。
上記の横棒グラフで描画した場合、以下のようなことを思うのではないでしょうか。
- 「投球割合が一番多いのはスイーパーである」ことがすぐわかり、2番目に投球割合が多いストレートとどれくらい数値で違うかというのもわかりやすい?(定量的な違いがグラフから読み取りやすい)
- 各要素(変化球)それぞれの割合がどれくらいなのかについて、視覚的・定量的に読み取りやすい。(ex. カットボールの割合はスイーパーの1/3くらいかなど..)
ちなみに、色を今回は主張したいスイーパーは赤、それ以外は薄ピンクというような同系色で強調をしていていますが、これも棒グラフで達成できる利点です。
この同系色で強調実施は円グラフではできません。なぜなら、円グラフでは、それぞれの要素を境界線の仕切りによって見分けているので、それが同系色(主張したい色以外)となった場合、各要素の判別ができなくなるためです。
結論・まとめ
具体例を見てもわかるように、「要素の大小関係」を主張するために円グラフは不向きと言えます。
確かに、私の今までの経験上も、円グラフを用いると、「その数値の大小関係が見にくい」や「そもそも何が重要かわかりにくい」といった指摘をもらったことがありました。
ただ、その代替的な方法として、棒グラフを用いることで視覚的に見えやすくなるということは今まで知らなかったので、今回学んだことを今後のデータビジュアライゼーション業務で生かしていきたいと思います。
補足
補足ですが、「2021年と2023年の変化球の投球割合を比較し、2023年度はスイーパーの割合が増加している」ということを主張したい場合も、以下のように横棒グラフで描画すると大変見やすいです。
上記の横棒グラフだと、例えば、2023年はスプリットの割合は減ったなとか、ストレートの割合が減ったななどといった全ての要素(変化球)についても視覚的に判別しやすいです。
また、以下のように左バッターと右バッターで変化球の割合を比較するというのも、棒グラフを使えば見やすくなるということがわかりました。
今までは、2つ期間などで同一の要素を比較する際、円グラフを2つ使って比較するということをやっていたので、今後は棒グラフを上手く使っていきたいと思います。