0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Fundamentals of Data Visualization 輪読会資料 第21回 (2024.07.22)

Last updated at Posted at 2024-07-21

当記事の位置づけ

概要

  • 図表に使用されるタイトルやキャプションの付け方、また表の扱い、という非常にいぶし銀な渋い内容の章です。

内容

22 まくら的な部分

  • データ可視化は、審美的な美術の文脈のものではなく、情報・要点を伝える事が大事だ。
  • その目的をうまく遂行する為には文脈にデータを据えて、タイトル、キャプション、その他の注釈を付ける必要がある。
  • この章では図にうまくタイトルを付ける方法、また表形式について語る。

22.1 図のタイトルとキャプション

第1パラグラフ

  • すべての図の重要な要素がタイトルだ。
  • タイトルの役目は、読み手にこの図が何を表すかを正しく伝えることだ。
  • しかし図のタイトルは必ずしも読み手が期待した場所には記載されないことがある。
  • 図22.1(以下)を参照の事。
    image.png

スクリーンショット 2024-07-21 12.33.50.png

  • タイトルは「汚職と人間開発:最も開発が進んだ地域では最も汚職が少ない」
  • このタイトルは図の上部には記載されていない。
  • しかしそのかわり、タイトルは図の下側、キャプション部の最初に記載される。
  • これはこの本において著者が通しているスタイルで、図の本体にタイトルを含めず、キャプションとともに記載する。(一部例外有り)

第2パラグラフ

  • 代替的に、タイトルやデータソースの説明などのキャプションも図に組み込むこともある(以下図22.2)
    スクリーンショット 2024-07-21 12.56.14.png

  • 図22.2は、図22.1と比べて魅力的だが、著者はこの本でこのスタイルを採らない。

  • それは、この2つのスタイルは適用分野が異なる為であり、タイトルを統合するスタイルは、従来の本のレイアウトには適さない為だ。

  • 大事な原則は「一つの図には一つのタイトル」であり、図に統合されているか、図の下部のキャプションの冒頭にあるかの、どちらかだ。

  • そして、出版物で図の下部にキャプションがある場合、タイトルは必ずその冒頭に書かれなければならない。

  • こういう理由で従来の出版物にはタイトルは図に統合されない。

  • タイトル、サブタイトル、データソースについての記述が統合された図というのは正しいが、それが正しいのは単独のインフォグラフィックであったり、SNSへの投稿であったりWebページであったり、キャプションの文章を伴わない場合となる。

文書レイアウトで各図の下にキャプション ブロックを使用する場合は、図のタイトルを図の上ではなく、各キャプション ブロックの最初の要素として配置します。

第3パラグラフ

  • 図のキャプションで一番やりがちな間違いというのは、キャプションの最初の要素としてのタイトルを省略してしまうところだ。
  • 図22.1のキャプションに戻ると、「腐敗と人間開発」という文章から始まっており、「この図は如何に腐敗が人間開発と関係するか」という文章ではない。
  • キャプションの最初の部分は必ずタイトルになり、その図の説明にはならない。
  • タイトルは文章でなくて構わないが、明確な主張を持つ短文がタイトルたりうる。
  • 例えば、図22.1で言えば、「最も開発が進んだ国では最も腐敗が少ない」というタイトルは良い。

22.2 軸と判例のタイトル

第1パラグラフ

  • すべての筋書きにはタイトルが必要であるのと同じように、すべての軸と判例にもタイトルが必要だ。(軸のタイトルは口頭表現では軸ラベルと言われる)
  • 軸と判例のタイトルやラベルは、表示されたデータが何であるか、またそれらが筋書きの美しさにどのように位置づけられるかを説明する。

第2パラグラフ

  • すべての軸と凡例に適切なラベルやタイトルが付けられたプロットの例を示す為、第12章で詳しく説明したアオカケスのデータセットを取得してバブルプロットとして視覚化した (図 22.3 )。
    スクリーンショット 2024-07-21 16.25.50.png

  • このプロットでは、軸のタイトルは、x軸(横軸)が体重をグラム単位で示し、y軸(縦軸)が頭の長さをミリメートル単位で示していることを明示的に示している。

  • 同様に、凡例のタイトルは、点の色が鳥の性別を示し、点のサイズが鳥の頭蓋骨のサイズをミリメートル単位で表す事を示している。

  • すべての変数について、関連するタイトルには、表示されている変数(体重、頭の長さ、頭蓋骨のサイズ)のみならず、その単位(mm, g )も記載されていることを強調しておく。

  • これは良い習慣で、可能な限り実施したほうが良いが、カテゴリ変数 (性別など) には単位は必要ない。

第3パラグラフ

  • 軸や凡例のタイトルを省略する場合は注意が必要だ。

    • 文脈上、何が明らかで何が明らかではないかを誤って判断しやすい為。
  • よく大衆紙で、軸タイトルを省略している不快なグラフを頻繁に目にする。

  • 例えば出版物によっては、図 22.5のような図を作成する場合がある。

    • 軸の意味がプロットのタイトルとサブタイトルから明らかであるという考えからだ。
      • タイトル:「大手テクノロジー企業 4 社の長期にわたる株価」
      • サブタイトル:「各企業の株価は2012年6月を100として正規化されている。
        スクリーンショット 2024-07-21 16.54.19.png
  • 著者は、コンテキストによって軸が明確に定義されるという観点には同意しない。

  • 通常、キャプションには「 x / y 軸が示しています」などの言葉が含まれていないため、図を解釈するには常にある程度の推測が必要だ。

  • 著者の経験では、軸が適切にラベル付けされていない図は、しつこく不確実性を感じさせる傾向がある。

  • たとえ、示されている内容を95%確実に理解しているとしても、100%確実であるとは感じない。

  • 一般的な原則として、読者に自分の言いたいことを推測させるのは悪い習慣だと思う。なぜ読者に不安感を与えようとするのか。

第4パラグラフ

  • 逆に、ラベルを貼りすぎる可能性もある。

  • 凡例に 4つの有名な企業の名前がリストされている場合、凡例のタイトル「企業(Company)」は冗長であり、何も役に立たない(図 22.6 )。
    スクリーンショット 2024-07-21 17.19.28.png

  • 同様に、一般にすべての量的変数の単位を報告する必要があっても、 X 軸に最近数年間のタイトルが「時間 (西暦年)」として表示されている場合は、扱いにくい (図 22.6 )。

第5パラグラフ

  • 最後に、場合によっては、軸のタイトルだけでなく軸全体を省略しても問題ない。
  • 通常、円グラフには明示的な軸がなく、

図10.1
スクリーンショット 2024-07-21 17.26.42.png

  • ツリーマップにもない。

図11.4
スクリーンショット 2024-07-21 17.27.43.png

  • モザイクプロットまたは棒グラフは、プロットの意味が明確であれば、一方または両方の軸なしで表示できる(図 11.3 および 6.10 )。

モザイクプロット(図11.3)
スクリーンショット 2024-07-21 17.28.37.png

棒グラフ(図6.10)
スクリーンショット 2024-07-21 17.29.57.png

  • 軸目盛りと目盛りラベルを含む明示的な軸を省略すると、グラフの特定のデータ値よりも、定性的特徴の方が重要であることが読者に伝わる。

22.3 表

第1パラグラフ

  • 表はデータを視覚化するための重要なツールだ。

  • しかし見た目が単純であるため、常に必要な注意を向けられているとは限らない。

  • この本では、表6.1、7.1、および19.1など、いくつかの表を示した。

表6.1
スクリーンショット 2024-07-22 0.49.59.png

表7.1
スクリーンショット 2024-07-22 0.50.15.png

表19.1
スクリーンショット 2024-07-22 0.50.38.png

  • 少し時間をとって、これらの表を見つけて、どのようにフォーマットされているかを確認し、あなたや同僚が最近作成した表と比較してみよう。

  • おそらく、重要な違いがあって、著者の経験では、表の書式設定に関する適切なトレーニングがなければ、直感的に正しい書式設定を選択できる人はほとんどいない。

  • 自己出版文書では、不適切に設計された図以上に不適切にフォーマットされた表がさらに蔓延している。

  • また、表の作成に一般的に使用されるほとんどのソフトウェアでは、推奨されないデフォルトが提供されている。

  • たとえば、著者の使うMicrosoft Word には 105 の事前定義された表スタイルが用意されているが、そのうち少なくとも 70 ~ 80 がここで説明する表のルールの一部に違反している。

  • したがって、Microsoft Word の表レイアウトをランダムに選択すると、80%の確率で問題のある表レイアウトが選択されることになる。

  • またデフォルトを選択すると、毎回不適切な形式の表が作成されることになる。


  • 表レイアウトの重要なルールは以下の通り。
    • 縦線は使用しない。
    • データ行の間に水平線を使用しない。
      • 水平線は、タイトル行と最初のデータ行の間の区切り文字として、または表全体の枠として使用できます。
    • テキスト列は左揃えにする必要がある。
    • 数値列は右揃えにし、全体で同じ数の 10 進数を使用する必要がある。
    • 単一の文字を含む列は中央に配置される。
    • ヘッダー フィールドはデータに合わせて配置される。つまり、テキスト列の見出しは左揃えになり、数値列の見出しは右揃えになる。

  • 図 22.7 の表は、第6章の表を4 つの異なる方法で再現したもの
    • そのうちの 2 つ (a、b) はこれらの規則のいくつかに違反している。
    • そのうちの 2 つ (c、d) は違反していない。

スクリーンショット 2024-07-22 1.00.50.png

第2パラグラフ

  • 作成者がデータ行の間に水平線を含む表を描くとき、​​その目的は通常、目が個々の行を追いやすくすることだ。
  • ただし、テーブルが非常に広くてまばらでない限り、通常はこの視覚補助は必要無い。
  • 通常のテキストでも行間に水平線を引かない。水平 (または垂直) 線の代償は、視覚的に煩雑になることだ。
  • 図22.7の (a) と (c) の部分を比較してみよう。
  • パート (c) はパート (a) よりもはるかに読みやすい。
  • 表の行を区切る視覚的な補助が必要であると思われる場合は、行の明るい部分と暗い部分を交互に付けると、あまり乱雑にならずにうまく機能する傾向がある (図 22.7 d)。

第3パラグラフ

  • 最後に、図と表の間には、表示項目に対してキャプションが配置される場所に重要な違いがある。
  • 図の場合はキャプションを下に配置するのが一般的だが、表の場合はキャプションを上に配置するのが一般的だ。
  • このキャプションの配置は、読者が図や表を処理する方法によって決まる。
  • 図の場合、読者は最初にグラフィック表示を見て、次にコンテキストのキャプションを読む傾向があるため、図の下にあるキャプションは意味がある。
  • 対照的に、表はテキストのように上から下に処理される傾向があり、キャプションを読む前に表の内容を読んでも役に立たないことがよくあります。 したがって、キャプションはテーブルの上に配置される。

個人的には、最初にタイトルがあったほうが理解し易いという気がするのですけどね。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?