1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Fundamentals of Data Visualization 要約

Posted at

本記事の位置づけ

下記書籍を用いた輪読会の資料として作成しています。
https://clauswilke.com/dataviz/proportional-ink.html

今回の対象範囲は、下記のとおりです。
17 The principle of proportional ink

本編

  • In all these cases, we need to make sure that there is no inconsistency.
    不整合はあってはならん!
    e.g. 棒グラフの始まる値が異なる(0から始まるものと0以外から始まるものが混在)
  • このコンセプトは BergstromとWestによる「the principle of proportional ink」で定義されている。

The principle of proportional ink: The sizes of shaded areas in a visualization need to be proportional to the data values they represent.

可視化における色が塗られたエリアは、値と釣り合っている(比例している)必要がある。
- "ink"という言葉に関して、可視化においては背景色と異なる部分を一般的に指す(points, 色が塗られたエリア、テキストなど)。しかしこの章では、色が塗られたエリアを指す。

17.1 Visualizations along linear axes 直線軸に関する可視化

  • Fig17.1はハワイの各地域の収入中央値を示している。ぱっと見、ホノルルは他の地域より裕福であるようにうかがえるが、misleadingである。

  • $50,000から棒が始まっているため、終わりの数字は各incomeのmedianを示しているが、棒の高さは50000から超過した分を表している。

  • 人間の知覚である棒の高さの方が、endpointの値より先に認識する。
    Fig17.1
    image.png

  • こちらが推奨版
    Fig17.2
    image.png

Bars on a linear scale should always start at 0.

  • 似たいような事例は時系列でも頻繁に発生する。例えば株の価格。

  • 特に線の下を色を塗っているため、x軸からの距離が強調され、視覚的にインパクトを与える。
    Fig17.3
    image.png

  • Y軸を0からにしたのがこちら。
    image.png

  • 小さな変化を繰り返しているなどには向かないかもしれないが、常に0から棒を描いた方が良い。

  • ハワイ州の中央値所得の変化を棒グラフで視覚化することができる。
    image.png

  • 同様にして、株価の変動も一時的に高いポイントだった10/22との差分を表現することもできる。

  • image.png

  • 色を塗った部分が下落幅を表現し、明示してなくても表現できる。

17.2 Visualizations along logarithmic axes 対数軸の可視化

  • 対数を利用する場合、エリアや大きさが値に比例しない。(軸に沿って直線的に配置されない??)

  • (The principle of proportional inkに照らし合わせると)対数を使って棒グラフは大きさが比例しておらず本質的には欠陥である。反面で、各棒の面積は値の対数に比例するためThe principle of proportional inkに適応する。

  • 量を可視化したいか、比率を可視化したいかが適切な問いである。

  • 対数は可視化に適しており、何かで割ったりかけたりするステップで構成されているからである。

  • ただ、対数は可視化に特化してはおらず、桁が大きくなる場合に使える。

  • 例えば、オセアニア地域のGDP。大小の差が大きく直線の軸は使えない。
    Fig17.7
    image.png

  • 17.7は使えない。まず、棒が0.3から始まり前段と同じ棒の長さが値を表現していない問題が発生する。

  • 対数なので0がはるか左にあり、棒を長くしようとする(Fig17.8)。

  • 棒の代わりに散布図に、Y軸に記載する代わりに右横に国を表記する。国名とドットの距離を近くする。

  • (個人的には軸が1と3が混在しており、良い例なのか分からない...)
    image.png

  • 金額より比率を可視化したい場合は対数軸は良い選択だろう。

  • パプアニューギニアのGDPを元に各国のGDPを可視化しよう。
    Fig17.10
    image.png

  • NZは8倍、オーストラリアは64倍であることが分かる。

  • 1以上だと右側、それ以下だと左側に来る。Log scaleは常に1から始める。

When bars are drawn on a log scale, they represent ratios and need to be drawn starting from 1, not 0.

17.3 Direct area visualizations

  • In these cases, we can consider the area encoding as incidental and secondary to the location encoding of the data value. ??
  • 他の可視化の手法はエリアで直接的に値を表現し、locationのマッピングはない。
  • 最も一般的なのは円グラフ
  • 角度が大きさを表現しているが、私たちは各エリアのサイズで判断している。
  • 角度が大きさと比例しているため、the principle of proportional inkを満たしている。
  • 棒グラフのエリアの認識とは異なる認識をするが、その理由は人間はエリアよりも距離の方が正確に認識する。
  • 棒グラフと円グラフを見比べてみると、どれだけ正確に判断できているか分かるだろう
  • Tree mapでも同様(Fig17.3)。円グラフや棒グラフと同じだが、各地域ごとの住人の違いはそこまで顕著ではなくなった。

分からないこと

英語

  • they are nowhere near as big as Figure 17.1.
     17.1ほど段違い、と訳したくなるが文脈的には逆だよね?
  • In these cases, we can consider/the area encoding /as incidental and secondary /to the location encoding of the data value.
    area encodingはthe location encoding of the data valueの次、副次的なものだと考えて良い?

以下は学び。分からないことなし

  • extent 範囲
  • convey 伝える
  • rectangles 長方形
  • arbitrary 任意
  • perceive 知覚する
  • nowhere near 何も近くない→ほど遠い
  • inherently 本質的に
  • flaw 欠陥
  • pronounced 明白(発音という意味だけでない)
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?