ナノポアで新しい種や系統のシーケンスをしてアセンブルすることは簡単になったが、アノテーションは色んなツールがあり過ぎて正解が分からない人は多いと思う。私もそうだった。そして一通りのやり方を通して説明してくれるサイトも見当たらないので、作っておくことにした。
このプロトコールでは、Anaconda、というか mamba (https://kazumaxneo.hatenablog.com/entry/2021/02/11/073000 を参照するとよい) を使った環境の管理を前提とする。また、デフォルトのチャンネルにbiocondaとcodna-forgeを追加していない人は以下のコマンドを実行しておくこと。
mamba config --add channels bioconda --add channels conda-forge
使用するツール群は以下の通り。
EDTA (https://github.com/oushujun/EDTA)
Braker2 (https://github.com/Gaius-Augustus/BRAKER)
GeMoMa (http://www.jstacs.de/index.php/GeMoMa)
Gffread/Gffcompare (http://ccb.jhu.edu/software/stringtie/gff.shtml)
HISAT2 (http://daehwankimlab.github.io/hisat2/)
TRINITY(https://github.com/trinityrnaseq/trinityrnaseq)
手順は以下の通り