Python
ShellScript
QIIME2

微生物群集解析ツール QIIME 2 を使う.Part1.(インストール,ファイルインポート編)

QIIME 2 を使う.

QIIME2 はDNAのシーケンスデータから微生物解析を行うためのオープンソースのパイプラインである.クオリティの高いグラフや統計の処理を行うことが可能である.

AT 2017 Advent Calendar のネタ用に書きました!ぜひやってみてね!

QIIME 2 のインストール

1. QIIME 2 コア 2017.12 distribution

QIIME 2 には以下のコマンドラインインターフェースが内蔵されている.
q2-alignment
q2-composition
q2-cutadapt
q2-dada2
q2-deblur
q2-demux
q2-diversity
q2-emperor
q2-feature-classifier
q2-feature-table
q2-gneiss
q2-longitudinal
q2-metadata
q2-phylogeny
q2-quality-control
q2-quality-filter
q2-sample-classifier
q2-taxa
q2-types
q2-vsearch

2. Miniconda のインストールする

Miniconda はQIIME 2 をインストールするための推奨方法なので,先にMiniconda をインストールする.
ちなみにMiniconda 2,3 のどちらでもよい(つまりPython 2,3の両方可).

conda install conda=4.3

3. QIIME 2 を Miniconda でインストールする

MacOS/OS X (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-osx-64.txt

Linux (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-linux-64.txt

4. QIIME 2 を起動する

source activate qiime2-2017.12

QIIME 2 にFastq ファイルをインポートする

今回は,ペアエンドであるL2S357_15_L001_R1_001.fastq.gzL2S357_15_L001_R2_001.fastq.gzなどの形式のfastq ファイルをQIIME 2 にインポートしてみる.

1. paired-end demultiplexed fastq(テストデータ)をダウンロードする

wget -O "casava-18-paired-end-demultiplexed.zip" "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

# または

curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip" > "casava-18-paired-end-demultiplexed.zip"

# ファイルを解凍する
unzip -q casava-18-paired-end-demultiplexed.zip

2. fastq ファイルをインポートする

--input path には解凍したディレクトリ, --output-path には出力するqza ファイルの名前を指定する.
QIIME 2 では,qza ファイルにさまざまな入力データを保存する必要がある.

qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path casava-18-paired-end-demultiplexed \
  --source-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-paired-end.qza

3. サマライズを行う

これを行うことにより,サンプルごとに取得された配列の数を確認することができる.また,シーケンスの配列クオリティの要約も得ることができる.

qiime demux summarize \
  --i-data demux-paired-end.qza \
  --o-visualization demux-paired-end.qzv

BIOM ファイルをインポートする

QIIME 1 で作成されたBIOM ファイルもQIIME 2 にインポートすることができる.

1. BIOM v2.1.0 フォーマット(テストデータ)をダウンロードする

wget -O "feature-table-v210.biom" "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom"
# または
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom" > "feature-table-v210.biom"

2. BIOM ファイルをインポートする

qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV210Format \
  --output-path feature-table-2.qza

アライメントされていないfna ファイルをインポートする

1. fna ファイルをダウンロードする

wget -O "sequences.fna" "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna"
# or
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna" > "sequences.fna"

2. fna ファイルをインポートする

qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'

3. fna ファイルをアライメントする

mafft を用いてアライメントを行う.

qiime alignment mafft \
  --i-sequences rep-seqs.qza \
  --o-alignment aligned-rep-seqs.qza

次回以降は, 読み込んだfastq ファイルのクオリティコントロール,Feature Table の生成の方法を書く予定です.