データ可視化アドベントカレンダー2020の記事です。
背景
2020年には、はんなりPythonに参加するなかで、PlotlyやDashのことをいろいろと知ることができました。また、運営の小川さんらの著書[『Python インタラテクィブ・データビジュアライゼーション入門 - Plotly/Dashによるデータ可視化とWebアプリ構築』][link-1]が出版されました。
[link-1]:https://amzn.to/3nqH4tX
小川さんの記事:"なぜデータをインタラクティブに可視化したいのか?"に書かれているように、インタラクティブなデータの可視化は、分析に役立ちます。
私は普段は大学の教員(微生物学)をしており、データを分析するのに、少しインタラクティブな図を作ってみて便利さを実感したことがあります。(このときは、Rのggplot2とggplotlyを使いました)
「これからは、学術論文の図などもこういう形(インタラクティブ)になっていくのかも知れないな」と思っていたところ、すでにそのような試みがあることを知りましたので、簡単に紹介します。
学術論文の体裁の変化
学術論文というと、元々紙に印刷されるもので、図も当然静止画でした。
近年は学術雑誌がオンラインでも読めるようになり(ここ10〜20年くらい?)、今ではHTML+PDF(+印刷物)という形が一般的です。印刷物がない、オンラインジャーナルも増えています。
しかし論文の中で結果を示す図は、Web上で読めるHTML版であってもPDF版と同じく、相変わらず静止画です。(補足データ(Supplemental data)という形で、顕微鏡のタイムラプス動画がついていることは良くありますが)
学術論文にインタラクティブな図を使う試み
F1000Research(以下、F1000res)という、学術論文を発表するオンラインプラットフォームがあります(彼らは、自分たちはいわゆる「学術雑誌」ではないと定義しています)。
F1000resはデータの透明性・再現性を重視するために生データの公開を義務付けいたり(これ自体は多くの雑誌でこのような流れになっている)、「査読を通過した論文を出版する」という順序ではなく「出版してから査読する(その過程も公開する)」という、学術論文出版における新しい取り組みをいろいろしています。
F1000resは、いろいろな試みの一つとして、2017年にPlotlyと提携して「インタラクティブな図を論文に取り入れる」試みを開始していました。開始当初の6か月間は、論文の中にインタラクティブな図が一つでもあれば、掲載料を半額にするというキャンペーンも実施していました。
"So long static – we now support interactive Plotly figures in our articles!"
またこの試みは、Natureでも紹介されていました。
"Data visualization tools drive interactivity and reproducibility in online publishing"
論文の例
インタラクティブ図を採用した論文のHTML版では、Plotlyバージョンと静止画バージョンとを両方載せるという仕組みです。例えば、この論文では、"Figure 3"から"Figure 12"が全て"Interactive Figure"になっています。各図の、"Interactive Figure"ボタンを押すと、インタラクティブ図が表示されます。"View static vertion of this image"を押すと、静止画バージョンが開きます。(PDF版では、静止画のみ)
他にも、次の記事の中でインタラクティブな図を使った論文がいくつか紹介されています。
“Interactivity in scientific figures is a key tool for data exploration and the scientific process”
また、F1000resがインタラクティブな図を使用した論文をcollectionとしてまとめています。
https://f1000research.com/collections/interactive-figs
単純な図でも、インタラクティブであればより多くの情報が得られる場合があると思うので、こういう論文が増えたら面白いですが、残念ながらこのcollectionを見る限りでは、キャンペーンのあった2017年と翌2018年に論文が合計7本あるのみで、あまり普及していないようです。
あんまり普及していない理由
インタラクティブな図が論文であまり使われていない理由としては、
- インタラクティブな図に馴染みがない。
- インタラクティブな図の作り方が分からない。
- インタラクティブな図が論文で使えることを知らない。
- プログラミングに馴染みがない。
などがあるのかなと思いました。もしかして、論文発表に至るまでの、データを見て試行錯誤する段階では使っている人はいるのかもしれません。
どうしたら普及するか?
インタラクティブな図がどうしたら学術論文の世界(特に生物・医学系)で普及するでしょうか?適当に考えてみました。
- 日々のデータ分析でインタラクティブ図を使って慣れ、便利さを実感する。
- ただし、生物系の学生・研究者はプログラミングに馴染みのない人が多いので(一部除く)、敷居が低いのが望ましい。
- プログラミングに馴染む機会が必要(最近の学生は馴染んでいるのかもしれないが・・)
- しかし、そういう方法(インタラクティブな可視化)があることをどこで知る?という問題がある。
- [PlotlyとDashの本][link-1]を図書館に置こう
- 『実験医学』など、学生の目にとまりやすい雑誌に紹介記事を載せる。
まとめ
インタラクティブな図を学術論文に取り入れるという試みがあるが、現状ではあまり普及していないようです。
今後普及するためには、インタラクティブな図の便利さを多くの人(研究者や学生)が実感する機会が増えると良いのではないでしょうか。
そういう私も、まだそんなに使ったことがないので、2021年には取り組みたいと思います。