LoginSignup
16

More than 3 years have passed since last update.

微生物群集解析ツール QIIME 2 を使う.Part1.(インストール,ファイルインポート編)

Last updated at Posted at 2017-12-25

QIIME 2 を使う.

QIIME2 はDNAのシーケンスデータから微生物解析を行うためのオープンソースのパイプラインである.クオリティの高いグラフや統計の処理を行うことが可能である.

AT 2017 Advent Calendar のネタ用に書きました!ぜひやってみてね!

QIIME 2 のインストール

1. QIIME 2 コア 2017.12 distribution

QIIME 2 には以下のコマンドラインインターフェースが内蔵されている.
q2-alignment
q2-composition
q2-cutadapt
q2-dada2
q2-deblur
q2-demux
q2-diversity
q2-emperor
q2-feature-classifier
q2-feature-table
q2-gneiss
q2-longitudinal
q2-metadata
q2-phylogeny
q2-quality-control
q2-quality-filter
q2-sample-classifier
q2-taxa
q2-types
q2-vsearch

2. Miniconda のインストールする

Miniconda はQIIME 2 をインストールするための推奨方法なので,先にMiniconda をインストールする.
ちなみにMiniconda 2,3 のどちらでもよい(つまりPython 2,3の両方可).

conda install conda=4.3

3. QIIME 2 を Miniconda でインストールする

MacOS/OS X (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-osx-64.txt

Linux (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-linux-64.txt

4. QIIME 2 を起動する

source activate qiime2-2017.12

QIIME 2 にFastq ファイルをインポートする

今回は,ペアエンドであるL2S357_15_L001_R1_001.fastq.gzL2S357_15_L001_R2_001.fastq.gzなどの形式のfastq ファイルをQIIME 2 にインポートしてみる.

1. paired-end demultiplexed fastq(テストデータ)をダウンロードする

wget -O "casava-18-paired-end-demultiplexed.zip" "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

# または

curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip" > "casava-18-paired-end-demultiplexed.zip"

# ファイルを解凍する
unzip -q casava-18-paired-end-demultiplexed.zip

2. fastq ファイルをインポートする

--input path には解凍したディレクトリ, --output-path には出力するqza ファイルの名前を指定する.
QIIME 2 では,qza ファイルにさまざまな入力データを保存する必要がある.

qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path casava-18-paired-end-demultiplexed \
  --source-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-paired-end.qza

manifest ファイルを使って指定したいときは,--input-path にmanifest ファイルを指定する.
https://docs.qiime2.org/2019.1/tutorials/importing/

3. サマライズを行う

これを行うことにより,サンプルごとに取得された配列の数を確認することができる.また,シーケンスの配列クオリティの要約も得ることができる.

qiime demux summarize \
  --i-data demux-paired-end.qza \
  --o-visualization demux-paired-end.qzv

BIOM ファイルをインポートする

QIIME 1 で作成されたBIOM ファイルもQIIME 2 にインポートすることができる.

1. BIOM v2.1.0 フォーマット(テストデータ)をダウンロードする

wget -O "feature-table-v210.biom" "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom"
# または
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom" > "feature-table-v210.biom"

2. BIOM ファイルをインポートする

qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV210Format \
  --output-path feature-table-2.qza

アライメントされていないfna ファイルをインポートする

1. fna ファイルをダウンロードする

wget -O "sequences.fna" "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna"
# or
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna" > "sequences.fna"

2. fna ファイルをインポートする

qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'

3. fna ファイルをアライメントする

mafft を用いてアライメントを行う.

qiime alignment mafft \
  --i-sequences rep-seqs.qza \
  --o-alignment aligned-rep-seqs.qza

次回以降は, 読み込んだfastq ファイルのクオリティコントロール,Feature Table の生成の方法を書く予定です.

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
16