QIIME 2 を使う.
QIIME2 はDNAのシーケンスデータから微生物解析を行うためのオープンソースのパイプラインである.クオリティの高いグラフや統計の処理を行うことが可能である.
AT 2017 Advent Calendar のネタ用に書きました!ぜひやってみてね!
QIIME 2 のインストール
1. QIIME 2 コア 2017.12 distribution
QIIME 2 には以下のコマンドラインインターフェースが内蔵されている.
・q2-alignment
・q2-composition
・q2-cutadapt
・q2-dada2
・q2-deblur
・q2-demux
・q2-diversity
・q2-emperor
・q2-feature-classifier
・q2-feature-table
・q2-gneiss
・q2-longitudinal
・q2-metadata
・q2-phylogeny
・q2-quality-control
・q2-quality-filter
・q2-sample-classifier
・q2-taxa
・q2-types
・q2-vsearch
2. Miniconda のインストールする
Miniconda はQIIME 2 をインストールするための推奨方法なので,先にMiniconda をインストールする.
ちなみにMiniconda 2,3 のどちらでもよい(つまりPython 2,3の両方可).
conda install conda=4.3
3. QIIME 2 を Miniconda でインストールする
・**MacOS/OS X (64bit)**の場合
conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-osx-64.txt
・**Linux (64bit)**の場合
conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-linux-64.txt
4. QIIME 2 を起動する
source activate qiime2-2017.12
QIIME 2 にFastq ファイルをインポートする
今回は,ペアエンドであるL2S357_15_L001_R1_001.fastq.gz
やL2S357_15_L001_R2_001.fastq.gz
などの形式のfastq ファイルをQIIME 2 にインポートしてみる.
1. paired-end demultiplexed fastq(テストデータ)をダウンロードする
wget -O "casava-18-paired-end-demultiplexed.zip" "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip"
# または
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip" > "casava-18-paired-end-demultiplexed.zip"
# ファイルを解凍する
unzip -q casava-18-paired-end-demultiplexed.zip
2. fastq ファイルをインポートする
--input path には解凍したディレクトリ, --output-path には出力するqza ファイルの名前を指定する.
QIIME 2 では,qza
ファイルにさまざまな入力データを保存する必要がある.
qiime tools import \
--type 'SampleData[PairedEndSequencesWithQuality]' \
--input-path casava-18-paired-end-demultiplexed \
--source-format CasavaOneEightSingleLanePerSampleDirFmt \
--output-path demux-paired-end.qza
manifest ファイルを使って指定したいときは,--input-path
にmanifest ファイルを指定する.
https://docs.qiime2.org/2019.1/tutorials/importing/
3. サマライズを行う
これを行うことにより,サンプルごとに取得された配列の数を確認することができる.また,シーケンスの配列クオリティの要約も得ることができる.
qiime demux summarize \
--i-data demux-paired-end.qza \
--o-visualization demux-paired-end.qzv
BIOM ファイルをインポートする
QIIME 1 で作成されたBIOM ファイルもQIIME 2 にインポートすることができる.
1. BIOM v2.1.0 フォーマット(テストデータ)をダウンロードする
wget -O "feature-table-v210.biom" "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom"
# または
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom" > "feature-table-v210.biom"
2. BIOM ファイルをインポートする
qiime tools import \
--input-path feature-table-v210.biom \
--type 'FeatureTable[Frequency]' \
--source-format BIOMV210Format \
--output-path feature-table-2.qza
アライメントされていないfna ファイルをインポートする
1. fna ファイルをダウンロードする
wget -O "sequences.fna" "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna"
# or
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna" > "sequences.fna"
2. fna ファイルをインポートする
qiime tools import \
--input-path sequences.fna \
--output-path sequences.qza \
--type 'FeatureData[Sequence]'
3. fna ファイルをアライメントする
mafft を用いてアライメントを行う.
qiime alignment mafft \
--i-sequences rep-seqs.qza \
--o-alignment aligned-rep-seqs.qza
次回以降は, 読み込んだfastq ファイルのクオリティコントロール,Feature Table の生成の方法を書く予定です.