背景
バイオインフォマティクスでは、MacBookの使用が推奨され、Windowsでの環境構築に関する情報が少ないです。この記事では、WSL2を使用して、Windows PCで分子系統樹解析を行うための環境構築方法を紹介します。バイオインフォをこれから始める人に向けて、丁寧に書いていきたいと思います。
動作環境
- Windows11
(Anaconda3のインストール後の操作は、Macの人も参考になると思います)
環境構築フロー
- WSL2のインストール
- Anaconda3のインストール
- Anaconda3で解析用の仮想環境を構築
- 各種パッケージのインストール
1. WSL2のインストール
WSL2とは、Windows Subsystem for Linux 2の略称で、Windowsコンピュータ上でLinux環境を構築することができます。Linuxと聞くとギョッとしてしまうかもしれませんが何も恐れることはありません!今までのWindows環境が壊れることもありません。
手順
これだけです。UbuntuというLinuxディストリビューションが自動的にインストールされます。ユーザー名とパスワードを設定しましょう(アルファベット)。
2. Anaconda3のインストール
AnacondaはPythonの開発環境を一括でインストール・管理できるツールです。バイオインフォマティクスで使用するツールを簡単にインストールできます。また、環境構築に慣れないうちは、試行錯誤の過程で現在の環境を汚してしまうことが多いですが、Anacondaの仮想環境を使えばそのような心配をしなくても大丈夫です。
Anaconda3のインストールについてはこのブログで詳しく紹介されています。この方法にならってインストールしてみましょう。
3. Anaconda3で解析用の仮想環境を構築
実際に仮想環境を構築します。一行目のコマンドはpythonのバージョンを3.12に指定し、「bioinfo」という名前の仮想環境を構築します。二行目のコマンドは、「bioinfo」の仮想環境を起動します。コマンドラインの先頭が(base) $
から (bioinfo) $
に切り替わったと思います。このコードを使用する場合は「$」以降をコピペしてください。
(base)$ conda create -n bioinfo python=3.12
(base)$ conda activate bioinfo
4. 各種パッケージのインストール
「bioinfo」の仮想環境に、分子系統解析に必要なパッケージをインストールしていきます。私は普段、以下の用途の時に右のパッケージを使用しています。他にインストールしたいパッケージがあれば、ここからパッケージを検索してインストールしましょう。
用途 | パッケージ |
---|---|
配列クラスタリング | cd-hit |
アラインメント | mafft |
ギャップ除去 | trimal |
系統樹推定 | iqtree |
以下コマンドで実際にインストールできます。このコマンドを使用する場合は「$」以降をコピペしてください。
(bioinfo)$ conda install bioconda::cd-hit -y
(bioinfo)$ conda install bioconda::mafft -y
(bioinfo)$ conda install bioconda::trimal -y
(bioinfo)$ conda install bioconda::iqtree -y
実際にmafftのインストール成功を確認します。mafft -v
と入力し、mafftのバージョンが表示されれば成功です。
(bioinfo)$ mafft -v
------------------------------------------------------------------------------
MAFFT v7.505 (2022/Apr/10)
https://mafft.cbrc.jp/alignment/software/
MBE 30:772-780 (2013), NAR 30:3059-3066 (2002)
------------------------------------------------------------------------------
~~省略
(おまけ)仮想環境の抜け方、削除
「bioinfo」の仮想環境から抜けるときは、conda deactivate
と入力します。
特に出力はありませんが、コマンドラインの先頭が(bioinfo) $
から (base) $
に切り替わったと思います。この時、再度mafft -v
と入力するとエラーが出力されます。
(bioinfo)$ conda deactivate
(base)$ mafft -v
bash: mafft: command not found
仮想環境を削除する時は以下のようにします。この環境が不要になったときや、pythonのバージョンの不一致により一部パッケージがインストールできないときは、仮想環境を消してしまいましょう。
(base)$ conda remove -n bioinfo
まとめ
Windowsでバイオインフォマティクスの実行環境を構築する方法について説明しました。Anacondaを使用しましたが、もちろんMinicondaでも大丈夫です。仮想環境を使用すれば、既存の環境を汚さずに環境構築できるので、初めての人こそ挑戦してみましょう!