はじめに
1年に1度の日本の分子生物学のビッグイベント、日本分子生物学会が今日から福岡で始まりましたね。今回の分生でも腸内細菌叢や環境DNA等、アンプリコン解析やメタゲノム解析関連のWorkshopが毎日のように開催されています(相変わらずaway感がありますが…)。
学会でメタゲノムを扱ったデータベースやツールのブースで説明要員をしていると、メタゲノムの情報解析手法について、わざわざブースに来て質問してくださる方が毎日何人もおり、ありがたい話です。
メタゲノマーやメタゲノムに興味がある人は着実に増えているように思います。
メタゲノムの情報解析
メタゲノム、実験計画やサンプリングの部分が極めて重要なのはもちろんですが、そこはOKだったとして、DNA配列データが得られた後の情報解析に苦労する場合が多いです。私もいつも頭を悩ませています。
様々な場所で色々な方々に、メタゲノムの情報解析について学べる資料は無いかと聴かれます。
個人的には、metagenome analysisのReview論文を何個か紹介したくなるのですが、おそらくそういうのではなくて、多くの場合答えとして求められているものはWebで無料で手に入る動画やスライド、チュートリアル記事なのかと思います。
ということで今日は3つほど、Webで無料で手に入るメタゲノムの情報解析について学べる資料を紹介します。
ただ、この分野は日進月歩なので、ここで挙げた資料も1,2年後には既に古すぎる内容になっているかもしれません。その辺は注意してください。
資料の対象レベル
UNIXコマンドある程度使えて、生物統計の知識がある人。
少しキツイレベルですね。
メタゲノムの情報解析の資料
以下の資料は動画とスライドがあったりしますが、基本的に、スライドをざっと見る感じの学習法をお勧めします。まず解析の大体の流れを知るのが重要です。
そこから先深く学ぶには、論文読んだり実際に何か適当なメタゲノムデータを解析してみたりすると良いかと思います。
資料1
まず、日本語の資料としては、今年の9月末のAJACS十勝2で私が90分ぐらいで喋ったメタゲノム解析ツールの概要の[スライド]
(https://togotv.dbcls.jp/ajacs2019033.html)。
CC-BYライセンス(ただし、スライド中で論文の図を貼り付けて引用している部分は、元論文のライセンスに準拠するので注意が必要。以下に紹介する他の資料でも同様だと思います)
「いきなり自分の資料最初に持ってくんのか」、とツッコミが入る気がしますが、まぁ許して。
資料2
次に、カナダのMetagenomic Data Analysis 2018という3日間のWorkshopのスライド集。
CC-BY-SAライセンス
Canadian Bioinformatics Workshopsというカナダの団体がホストしているWorkshopの一つ。メタゲノム以外にも過去に開催された様々なバイオインフォマティクスに関するWorkshopの資料がCC-BY-SAライセンスで公開されており、とても勉強になります。
資料3
最後に、EUのバイオインフォマティクスの研究所であるEBIで開発、運用されているメタゲノムデータベース、MGnifyのチームがメインで2018年に開催したMetagenomics Bioinformaticsという4日間のトレーニングコースのスライド。
CC-BY-SAライセンス
コースで用いたDocker imageは以下にありますが、"If downloading the container for the entire course you will need a minimum of 4CPUs, 16GB RAM of memory, 100GB Disk memory, 500MB GPU. "とか書いてあるので全部ダウンロードする際はディスクの空き容量に注意してください。
https://hub.docker.com/r/ebitraining/metagenomics/tags/
以上、学会出張の夜にホテルで走り書いてみました。