微生物群集解析ツール QIIME 2 を使う.Part2.(QC,FeatureTable生成編)

QIIME 2 を使う.

QIIME2 はDNAのシーケンスデータから微生物解析を行うためのオープンソースのパイプラインである.クオリティの高いグラフや統計の処理を行うことが可能である.

今回は,前回の微生物群集解析ツール QIIME 2 を使う.Part1.(インストール,ファイルインポート編)の続きで,fastq ファイルのクオリティコントロール(QC)とFeature Table の作成を行う.

Fastq ファイルのクオリティコントロール(QC)を行う.

DADA2はIllumina のアンプリコン配列を検出し修正するパイプラインである.Phix配列やキメラ配列をフィルタリングしてくれる.

公式チュートリアルでは,dada2 denoise-singleになっているが,今回のデータはpaired-end のデータなのでdada2 denoise-pairedで実行する.
deblur error "Argument to parameter 'demux' is not a subtype of SampleData[SequencesWithQuality]."

dada2 denoise-paired メソッドでは,4つのパラメータを与える.

--p-trim-left-f x:各シーケンスのforward 配列の初めからx個目までを削除する.
--p-trim-left-r y:各シーケンスのReverse 配列の初めからy個目までを削除する.

採用する最大配列長には結合したペアエンドリードが十分重なる長さを指定することが求められる.

--p-trunc-len-f m:各シーケンスのforward 配列のm個の塩基を採用する最大配列長を決定する. m個以降の塩基は除去する.
--p-trunc-len-r n:各シーケンスのreverse 配列のn個の塩基を採用する最大配列長を決定する. n個以降の配列は除去する.

--p-n-threads k:解析に使用するスレッド数を指定する.

プライマー配列は取り除く必要があるので、先頭側のカット長はプライマー配列長を通常指定する.

qiime dada2 denoise-paired \
  --i-demultiplexed-seqs demux-paired-end.qza \
  --p-trim-left-f 25 \
  --p-trim-left-r 25 \
  --p-trunc-len-f 120 \
  --p-trunc-len-r 100 \
  --o-representative-sequences rep-seqs-dada2.qza \
  --o-table table-dada2.qza
  --p-n-threads 30
# 名前を変更する(別にしなくても良いがqiime2のチュートリアルでの汎用性を考えてここでは変更しておく)
mv rep-seqs-dada2.qza rep-seqs.qza
mv table-dada2.qza table.qza

Feature Table の生成とサマライズを行う.

クオリティのフィルタリングが完了したら,結果を調べるためにFeature Table を生成する.

feature-table summarize:各サンプルに関連付けられているシーケンスの数、各特徴、それらの分布のヒストグラムを出力する.
feature-table tabulate-seqs:Feature ID のシーケンスへのマッピングとNCBI database に対するBLAST検索のリンクを提供する.

# metadata ファイルをダウンロードする
wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.12/tutorials/moving-pictures/sample_metadata.tsv"
#or
curl -sL "https://data.qiime2.org/2017.12/tutorials/moving-pictures/sample_metadata.tsv" > "sample-metadata.tsv"

# サマライズの実行
qiime feature-table summarize \
  --i-table table.qza \
  --o-visualization table.qzv \
  --m-sample-metadata-file sample-metadata.tsv

qiime feature-table tabulate-seqs \
  --i-data rep-seqs.qza \
  --o-visualization rep-seqs.qzv
Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account log in.