TL; DR
- バイオインフォのソフトウェアパッケージを作る研究者は多くない
- 多くないということはそのスキルはキャリア形成に有利
- みんな BioPackathon 入ろうぜ
はじめに
「とにかく論文を書かないといけない、ソフトウェアパッケージングスキルなんて学習してる暇は無い」っていう感じの方が多いかと思います。
でもそういうのって基本的に「修羅の道のトラディショナルな研究者のキャリアパスしか自分は考えてない」って感じそうで、そんな能力・自信の無い僕には自分に関係のある話に聞こえませんでした。
しかしそういう人が多いというのは(逆にソフトウェアパッケージングなんてもんができる人の)「人材の価値が大きく、キャリア形成において有利」(になるかもしれない)ということであり、「生きていく上で美味しい技術」ということでもあります。なので、若手のキャリア形成とか専門性の選択といった文脈で「ソフトウェアパッケージングスキル」が出てもいいのかな、と思っています。
本記事では、Bioconductor Community Advisory Boardという立場から「Bioconductor(バイオインフォマティクスの最重要Rパッケージ集)の貢献者が(日本で)足りてない」問題について考えていこうと思います。
本記事の主なターゲット
- 生命系の研究しながらある程度プログラミングもやってるけど、「トラディショナルな研究者の道」に進む自信は無い、ぐらいの人
- バイオインフォ興味あるしやってみたいけどとっかかりがない人たち
- キャリアに漠然とした不安抱える生物系の学生
以下の話題は対象外
- 「そもそもソフトウェアパッケージ(ング)とは何か」
- Bioconductorとは何か
- BioPackathonとは何か
- ソフトウェアパッケージのネタはどうやって得るか、みたいな話
そもそもソフトウェアパッケージ作者が足りていない問題
Bioconductorのパッケージ作者数を例に
研究のソフトウェアをパッケージとしてまとめる人は少ないんですが、その具体例として日本のBioconductorのpackageメンテナーの数は海外と比較して圧倒的に少ないです。
https://www.bioconductor.org/packages/release/BiocViews.html#___Software をひたすら目grepした感じでは、おそらく日本にお住まいのメンテナーは3名+数人(確認漏れてたらすみません!)程度だと思います。(アノテーションや実験データのパッケージを除いたもので)全パッケージ数が1974なので日本の貢献は1974分の3しかないということです。
バイオインフォの人材数とBioconductorのパッケージ作者数
@Yohei__K さんの 人材市場的な視点からバイオインフォを考えてみる によると、「バイオインフォ人材はおそらく数千人程度のオーダーです。」とのことです。
数千分の3ってどんだけだよって話かと。
みんな BioPackathon 入ろうぜ
今までの話を踏まえた学生へのメッセージがこちらになります。
- 人材の足りなさがすごいので、目立ちやすい
- 将来が不安な生命系の学生は、大学院時代でソフトウェアパッケージ作成スキルを身につけるのは一つの選択肢
- コロナで地理的束縛が無くなってきており(外国のソフトウェアコミュニティのZoomに参加する機会があれば)、リアル英語を強制(矯正?)的に学習できる
- パッケージ作成をピアサポートするコミュニティ(==BioPackathon) もある
- 一人で悩むより時間を節約できる
終わりに
「自分は生命科学の研究職になるんじゃ!」って方がほとんどかと思いますが、一風変わった(生命科学の)ソフトウェア技術の専門家になるってのも(今んとこ日本では相手にされないかもですが)なくはないんじゃないでしょうか。
(まともに就職したことが無く)民間企業のことはわからないのですが、もしかしたら注目されるかもしれません。
といっても「どうやってソフトウェア技術を身につけていけばわからない」っていう事情もあるかと思うので
BioPackathon というソフトウェアパッケージングに関するコミュニティでは月1のZoom のミートアップ以外に
統合TV にそのあたりをサポートする動画も投稿していこうとしてます(何かリクエストがあれば twitter なりでお気軽にご連絡を!)。
それではみなさん良いお年を、ちなみにすでにリンクを挙げましたがこのエントリーのプロットは
@Yohei__K さんの 人材市場的な視点からバイオインフォを考えてみる
の丸パクリです:)