Edited at

MacでBioconda〜RNA-Seqデータ解析ツールのインストール〜

More than 1 year has passed since last update.

MacでBiocondaを試しに入れてみたというお話。


なぜやったか

先週の次世代シーケンサーデータ解析ハンズオンワークショップに参加しました。そこでの、個人的な収穫は


  1. Biocondaの存在を知った

  2. データ解析に使われるコマンドラインツールの組み合わせがわかった

の2点です。

私自身、次世代シーケンサーのデータ解析をやろう、としたときに感じたことは


  1. ツールの種類が多いのでどれをどう組み合わせれば良いかわかりづらい

  2. インストールに失敗してそもそも使うところまでいかない

という、高い高い2つのハードル。

今回、これが一気に解決したので参加できて良かったです。

特にbiocondaについては、Homebrew+pyenv+Anacondaの組み合わせでPythonパッケージ管理を日常的に行なっているので、とても便利に感じました。


具体的になにをやったか

RNA-Seqのデータ解析について、講師の川原善浩さんのGitHubページの資料(PDF)を元に、de novoトランスクリプトーム解析に使うツールセットをBiocondaでインストールしてみました。

インストールしたのは以下の8つのツール。


  • FastQC

  • Trimmomatic

  • Trinity

  • Bowtie2

  • Salmon

  • Jellyfish

  • BLAST+

  • edgeR (R/Bioconductor)

Bioconda自体のセットアップは以下の手順で行いました。


  1. Homebrewのインストール

  2. pyenvのインストール

  3. minicondaのインストールとbiocondaチャネルのadd

OSはmacOS High Sierraです。


どのようにやったか

上記の手順を詳細に書いていきます。以下は参考にしたページ。

参考にしたページ:

Biocondaの公式ページ

Biocondaのパッケージ一覧ページ

Homebrewの公式ページ

MacOS High SierraでPython環境構築(再)

複数人で使用しているPCでのhomebrewの正しい使い方

pyenvを使ってMacにPythonの環境を構築する

以下はBiocondaの論文情報。

Bioconda: A sustainable and comprehensive software distribution for the life sciences

Ryan Dale, Björn Grüning, Andreas Sjödin, Jillian Rowe, Brad A. Chapman, Christopher H. Tomkins-Tinch, Renan Valieris, The Bioconda Team, Johannes Köster

(リンク:bioRxivのページ(無料)Nature Methodsのページ(有料)


1. Homebrewのインストール

詳細を表示

Homebrewをhomebrewディレクトリにインストールします。その後、PATHを設定します。

具体的には、ターミナルで以下のように実行します。

$ mkdir homebrew

$ curl -L https://github.com/Homebrew/homebrew/tarball/master | tar xz --strip 1 -C homebrew
$ nano ~/.bash_profile

# ~/.bash_profileに以下を追記
# export PATH="$HOME/homebrew/bin:$PATH"

$ source ~/.bash_profile
$ brew update

個人的にはPATHはechoコマンドとリダイレクトで入れるより、nanoエディタなどで全体を把握しながら追記する方が安心できるので好みです。



2. pyenvのインストール

詳細を表示

次にpyenvをインストールし、PATHを設定します。

ターミナルで以下のように実行します。

$ brew install pyenv

$ nano ~/.bash_profile

# ~/.bash_profileに以下を追記
# export PYENV_ROOT="$HOME/.pyenv"
# export PATH="$PYENV_ROOT/bin:$PATH"
# eval "$(pyenv init -)"

$ source ~/.bash_profile

これでpyenvは準備完了です。



3. minicondaのインストールとbiocondaチャネルのadd

詳細を表示

次にminicondaをインストールし、新しく作成したディレクトリにローカルのminiconda環境を構築したのち、biocondaチャネルをaddします。

ターミナルで以下のように実行します。

$ mkdir rna-seq

$ pyenv install -l | grep miniconda

miniconda-latest
miniconda-2.2.2
miniconda-3.0.0
miniconda-3.0.4
miniconda-3.0.5
miniconda-3.3.0
miniconda-3.4.2
miniconda-3.7.0
miniconda-3.8.3
miniconda-3.9.1
miniconda-3.10.1
miniconda-3.16.0
miniconda-3.18.3
miniconda2-latest
miniconda2-3.18.3
miniconda2-3.19.0
miniconda2-4.0.5
miniconda2-4.1.11
miniconda2-4.3.14
miniconda2-4.3.21
miniconda2-4.3.27
miniconda2-4.3.30
miniconda3-latest
miniconda3-2.2.2
miniconda3-3.0.0
miniconda3-3.0.4
miniconda3-3.0.5
miniconda3-3.3.0
miniconda3-3.4.2
miniconda3-3.7.0
miniconda3-3.8.3
miniconda3-3.9.1
miniconda3-3.10.1
miniconda3-3.16.0
miniconda3-3.18.3
miniconda3-3.19.0
miniconda3-4.0.5
miniconda3-4.1.11
miniconda3-4.2.12
miniconda3-4.3.11
miniconda3-4.3.14
miniconda3-4.3.21
miniconda3-4.3.27
miniconda3-4.3.30

$ pyenv install miniconda3-4.3.30
$ cd rna-seq/
$ pyenv rehash
$ pyenv local miniconda3-4.3.30
$ conda -V
conda 4.5.11

$ conda config --add channels bioconda
$ conda config --add channels conda-forge

これでbiocondaの準備ができました。



4. RNA-Seqのデータ解析に使う8ツールのインストール

詳細を表示

全てconda installで問題なくインストールできました。

・FastQC

$ conda install fastqc

・Trimmomatic

$ conda install trimmomatic

・Trinity

$ conda install trinity

・Bowtie2

$ conda install bowtie2

・Salmon

$ conda install salmon

・Jellyfish

$ conda install jellyfish

・BLAST+

$ conda install blast

・edgeR (R/Bioconductor)

$ conda install -c r r

$ conda install bioconductor-edger


まだ問題なく使えるかは試せていませんが、ぼちぼち試していくつもりです。