このサイトからKraken2の構築済みのインデックスをダウンロードできます。
ちゃんと公式サイトにもそう書いてある。公式ドキュメントはよく読もう。
もう少し詳しく
Kraken2とは
Kraken2は、DNA配列に分類学的なラベルを割り当てるためのツールです。高い精度と高速な分類速度を実現するために、正確なk-merマッチングを使用します。Kraken2は、クエリシーケンス内のk-merを調べ、そのk-merを含むすべてのゲノムの最も近い共通祖先(LCA)にマップするデータベースを使用します。Kraken2は、Johns Hopkins UniversityのDerrick Wood氏と彼のチームによって開発されました。
インデックスの構築
Kraken2はサーバーから配列を取得してインデックスを構築する。
kraken2-build --standard --db mydb --threads 16
しかしエラーが出て最後までいけないことが多い。Qiita上にもそんなエラーに対処している記事があります。
今日も
gzip: plasmid.5.1.genomic.fna.gz: invalid compressed data--format violated
みたいな感じのエラーが出てコケました。これについてGitHub上にissueやPRも出ていましたが、下記ページからダウンロードした方が早いようだ。
年に1回程度更新されているようで、最新でないといけない理由がなければこちらを利用した方がよさそうです。
この記事は以上です。