1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

輪読会 英語でデータ可視化を学ぼう:第6回

Posted at

本記事の位置づけ

下記書籍を用いた輪読会の資料として作成しています。
https://clauswilke.com/dataviz/boxplots-violins.html

今回の対象範囲は、下記のとおりです。
10 Visualizing proportions

本編

まとめ

導入

  • 円グラフは色々なところに偏在するが、有害である( The archetypal such visualization is the pie chart, omnipresent in any business presentation and much maligned among data scientists.)

円グラフに恨みがありすぎでは

10.1 A case for pie charts

  • 1976–1980年のドイツの議会(CDU/CSU, SPD, and FDP)の議席数
    image.png

  • 長方形にしたいなら、棒グラフがある。
    image.png

  • それぞれの区分を横に並べることもできる。

    • メリットはそれぞれのグループを直接比較可能
    • 一方で、全体の合計はぱっと見では分からない
      image.png
  • たくさんの著者は、円グラフを断定的に嫌い、積み上げ棒グラフ(stacked bar)やside-by-side棒グラフに賛成だと主張する(argueはこの場合主張と理解)

  • 他はいくつかの用途では、円グラフも活用できると主張する。

  • 著者自身の意見としては、これらのどの可視化も他より上位でない?(My own opinion is that none of these visualizations is consistently superior over any other. )

  • データとあなたが伝えたいストーリ次第で、選べばよい。

  • 上記のドイツ議会の例だと、円グラフがベストチョイスだと思う。

    • SPDとFDPが連立すれば、CDU/CSUを超え、過半数を少し上回ることができる
    • この事実は他の棒グラフでははっきりとはわからない
      -一般的に、円グラフは
    • 目標が半分、1/3などはっきりしていると分かりやすい。
    • またデータが小さいと良い。
  • 10.2aの積み上げ棒グラフは少し変に見える。

  • 一方で、

    • 積み上げ棒グラフは複数の条件で時系列で比較することができる。
    • image.png
    • side-by-side棒グラフは直接それぞれの比を比べたいときに良い。
    • サマリーはこちら
    • image.png
  • ドイツ議会の例で円グラフがベストチョイスという点は、確かに。そのストーリーの場合、割合もラベルの下に載せるとなおよい(今回は50%なので分かりやすいが30%などの場合だと分かりづらい)
  • 10.2aの積み上げ棒グラフは少し変に見えるとあるが、そうでもなくない?円グラフを擁護しすぎである。
  • 積み上げ棒グラフは用途が少ないのか...確かに円グラフやside-by-sideに比べると中途半端かもしれない(直接比較はできないし、割合も良く分からない。)

10.2 A case for side-by-side bars

  • 円グラフは適さない例を紹介しよう

  • 仮に、ABCDEの5社あり、それぞれだいたい20%と、同じような割合をマーケットで占めているとしよう

  • 連続した3年間を円グラフで比べることはムズカシイ

  • マーケットシェアが分からない

  • image.png

  • 一方で積み上げ棒グラフにすると、Ag成長しEが落ちていることが分かる。
    image.png

  • しかし、各都市の中での相対的なマーケットシェア(B、CとDどちらが大きいかなど)は分かりづらい。だから通常おすすめしない

  • この場合は、side-by-side棒グラフをおすすめする

  • A,Bが増加し、DEは減っていることが分かる。

  • image.png

  • side-by-side棒グラフ、より見やすくなったかと言われたら、あまり変わらないのでは...それより積み上げ棒グラフで斜め線を入れたらどうか
  • image.png

10.3 A case for stacked bars and stacked densities

  • 積み上げ棒グラフについて、構成要素が2つの場合は前述した開始位置が変わる点は解消される
  • 例えば議会の女性比率
  • ルワンダ(2016年女性の議員の人数がもっとも?多い)を見る。2008年から女性が過半数を占め、2013年には2/3が女性。この移り変わりを可視化したいなら、積み上げ棒グラフ
    image.png
  • 割合の変化を見せたいなら積み上げ棒グラフより、積み上げ密度棒グラフ(Stacked densities)
    • 無限になる場合は、いくつも横に積み上げ棒グラフが連立するので、Stacked densitiesに
  • stacked densitiesの例として、人々の健康状態
    • 年齢は連続値をとるし、条件は2つよりも多いが良いだろう。
    • 全体的に健康は年を取ることに下がっていることが分かるし、半分以上は年をとっても健康状態がgood / excellentにあることが分かる。
      image.png
  • 一方で限界アリ。この比率の可視化は若い人、年を取っている人が何人いるか分からない。健康な人の人数が変わらなくても、年を取るにつれて全体の人数が減っていたら、割合が減る。これを解決するのが次。

10.4 Visualizing proportions separately as parts of the total

  • Side-by-side棒グラフの全体が分からない問題、積み上げ棒グラフの変化が分からない問題を解決するのがこれ
    image.png

  • グレーが全体を表していて、goodは30-40で減少し、fairは変わらないことが分かる。

  • 次は結婚の状態について。

    • どんどん変わっていくので、stacked densitiesだと結婚状態と年齢に光が当てづらい
      image.png
    • その代わりにpartial densitiesを使う。
    • marriedが30でピークになるが、divorcedが40代でピークになることが分かる
      image.png
  • 一方で上記は、ある時点での関連した比率を見ることができあに。

    • 例えば、何歳で50%以上の人がmarriedになるか分かるようにするにはこちら
      image.png
    • 似ているが、比率をy軸に出す。20代でmarriedは過半数を超えるが、配偶者をなくした方(widowed)は70代で過半数になる。
  • stacked densitiesはあまり使ったことがないので、今度使ってみたい。

初めて習った英単語

  • omnipresent 遍在する、どこにもいる
  • archetypal 典型的な
  • maligh 有害な
  • parliament 議会
  • fraction ごく少数、比、割合
  • rectangle 長方形
  • vertically/horizontally 垂直方向/水平方向
  • categorically 断定的に
  • application 適用、応用、活用、利用、使い道、充当
  • ruling 統治、判決
  • coalition 連立
  • have a small majority over~ :過半数{かはんすう}を少し上回って
  • critique 批評する
  • consecutive 連続した
  • obscure 良く見えない
  • Marital 結婚生活の

分からなかったところ

  • The archetypal such visualization is ~ : ビジュアライゼーションのようなものということか?
  • My own opinion is that none of these visualizations is consistently superior over any other.:著者自身の意見としては、これらのどの可視化も他より上位でない?
  • which as of 2016 tops the list of countries with the highest proportion of female parliament members. topsなので、上位群にいるorlist of countriesの中でtopなのか
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?