はじめに
MMSeq2を使うと、高速でblastができるらしいので入れてみる
(DiamondよりE-valueの扱いが適切らしい)
raw readを直で遺伝子に当ててHGTを探すとかの利用を想定
元論文
https://www.nature.com/nbt/journal/vaop/ncurrent/full/nbt.3988.html
githubのページ
https://github.com/soedinglab/MMseqs2
インストール
cmakeでいれる
K生研biasのヒトは
scl enable devtoolset-3 bash
を売ってGCCを4.9に上げる
ソースをおとしたら中に入って
mkdir build
する
そして
cmake -DCMAKE_BUILD_TYPE=RELEASE -DCMAKE_INSTALL_PREFIX=. ..
makeファイルが無事できたら
make
make install
ディレクトリ中に
/MMseqs2/build/bin/mmseqs
/MMseqs2/build/util/bash-completion.sh
ができる。
/MMseqs2/build/util/bash-completion.sh
が初期化用スクリプトなので
.bash_profile で毎回読み込むように書いておく
source path/to/mmseqs/util/bash-completion.sh