概要
データ分析や論文執筆にデータの可視化は不可欠ですが、ただデフォルトの設定でグラフを作るだけでは不十分です。良いグラフを作るために気をつけたいことをまとめました。(ほぼ翻訳です)
元論文
Rougier NP, Droettboom M, Bourne PE(2014) "Ten Simple Rules for Better Figures"
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003833
筆者によれば、大切なのは
#####1. 読者層を理解すること
#####2. 主張を明確にすること
#####3. 媒体に合ったグラフにすること
#####4. キャプションを必ずつけること
#####5. グラフ作成ソフトのデフォルト設定を過信しないこと
#####6. 色を効果的に使うこと
#####7. 読者を誤解させないこと
#####8. 「チャートジャンク」を避けること
#####9. 見た目よりも内容を重視すること
#####10. 良いツールを使うこと
の10個です。あくまでサイエンスに関わるデータの可視化において、ですので、別分野(特に芸術)には適用できないことに注意してください。
##1.読者層を理解する
デザインをする過程でできるだけ早く行われるべきなのがこれです。
もしグラフが自分や共同研究者の理解を助けるためだけに使われるなら、装飾や解説は不要です。もしそのグラフをジャーナルなどに投稿するつもりなら、データが正確かつ網羅的に可視化されていることが必要になります。学生に見せる目的ならば、もう少し詳しく解説を載せて分かりやすくする必要があるかもしれません。最も注意しなければならないのは、一般大衆に発表する時です。データがシンプルでにまとまっていて、本当に大切な事項だけに絞られていなければ理解してもらえません。
##2.主張を明確にすること
論文であれプレゼン資料であれ、グラフは文字だけでは長すぎてよく理解できないような内容を一目で分かるようにするために使われます。よって、「そのグラフで何を伝えたいのか?」ということをはっきりさせることが大切です。それがはっきりしないままでは、どれだけ時間を費やしても良いグラフは生まれません。
##3.媒体に合ったグラフにすること
グラフはポスターや紙に載ることもあれば、コンピューターのスクリーンに表示されることもあります。媒体によってグラフのサイズが変わるだけでなく、読者の読み方も変わるということを意識しましょう。以下はその例です。
【プレゼンの場合】
グラフはほんの短い時間しか表示されないので、聴衆がパッと見てすぐに理解できるようなシンプルで要点が分かりやすいデザインにすべきです。しかもグラフはプロジェクターで投影され、聴衆は多少離れた場所にいるはずですから、線や点は大きく(太く)はっきりした色で描かれていないと読んでもらえません。
【論文の場合】
読者が好きなだけ長くグラフを眺めることができる分、詳細や補足事項などをたくさん載せても大丈夫です。
コンピュータースクリーンならズームもできるので尚更でしょう。
したがって、論文からそのままグラフを取ってきてプレゼン用スライドに貼り付けるのはあまり良い手段であるとは言えません。
##4.キャプションを必ずつけること
グラフの内容がなんであれそれを見るだけで全てを理解することはできません。つまり、グラフの見方やグラフには載せられなかった情報などをキャプションとして記載しておく必要があります。ここでいうキャプションは、プレゼンやポスター発表の際に口頭で説明する内容と似ていますが、読者が疑問に思いそうな点を先に説明しておくという点で異なります。
##5.グラフ作成ソフトのデフォルト設定を過信しないこと
エクセルやmatlab, matplotlibなどはどれも独自のデフォルト設定を持っており、それを使えば簡単にグラフを作ることができます。しかし、そういったデフォルトはどんなタイプのグラフにも対応できるように作られているため中途半端です。グラフを作る際はデフォルトに何かしらの変化を与えて、より良いものを作ることを心がけましょう。
##6.色を効果的に使うこと
色は人間の視覚の中でも非常に大きな要素であり、グラフ作成においても同じくらい重要です。エドワードタフテ[^1] が書いたように、色はあなたの最高の味方にも最低の敵にもなりえます。もし色を使いたいなら、「どんな色をどこに使うか、本当にそれは必要か」を考えましょう。何かを強調したいなら、それだけに色をつけて他はグレーや黒にしておくというのは効果的です。しかし、大した理由もなく色をつけようとしていると気がついたら、自制しましょう。
また、色覚特性を持つ読者のことを考えて、似た色をたくさん使うのは避けましょう。
##7.読者を誤解させないこと
科学的なグラフとその他の図表との違いは、「それが科学的データに紐づけられているか否か」です。この紐づけが少しでも曖昧になれば、データの客観的事実が伝わらなくなってしまいます。問題なのは、この紐をしっかりと締めておくのが案外難しいということです。気づかないうちにグラフ作成ソフトが勝手に(自動的に)縮尺を変更してしまって誤解を生むこともありますし、定量的な比較にパイチャートを使ってしまって本来の意図が伝わらないということも起き得ます。(人間は異なる形のサイズの比較が上手くできません)
##8.「チャートジャンク」を避けること
チャートジャンクとは不要な装飾のことです。グラフを無駄にカラフルにしたり、ラベルをたくさんつけてみたりするのはやめましょう。可能な限りインクを消費しないグラフが理想的だとエドワードタフテも言っているようです。これに関してはカイザーフォンのこのサイトがより詳細に説明しています。 https://junkcharts.typepad.com/
##9.見た目よりも内容を重視すること
長い時間を掛けてグラフ作成の技術は進化してきました。科学の分野ごとにフォーマットがある場合はそれを参照するのが良いでしょう。また、自分の研究と似た内容の研究で優れたグラフを見つけたら、真似してみるのも良いでしょう。(コピーは違法です。)
ただしweb上でグラフを探すときに注意が必要なのは、科学用のグラフと芸術とは全く別物だということです。情報が増えるにつれてネット上には色々なグラフが入り混じっていますが、科学で大切なのは内容であり、見た目は二の次です。
##10.良いツールを使うこと
みなさんご存知でしょうがデータの可視化ツールはかなり進化していて、自分に合ったものを使えばかなりの時間を節約できます。時には分析や研究で使ったデータをエクスポートして別ソフトで可視化するようなことも必要になります。
以下は便利なツールの簡単なリストです。
- Matplotlib
- R
- Inkspace: ベクトル画像編集用フリーソフト
- TikZ and PGF: Tex用のグラフ作成パッケージ
- GIMP: 画像のリタッチなど
- ImageMagic: コマンドラインで使えるビットマップ画像編集用ソフト
- D3.js: JavaScript用のグラフ作成ライブラリー
- Cytoscape: ネットワークの可視化ソフト
- Ciros: ゲノム解析用の可視化ソフト
#終わりに
元の論文には例となるグラフがたくさん載っているのでぜひ目を通してみてください。