Help us understand the problem. What is going on with this article?

微生物群集解析ツール QIIME 2 を使う.Part1.(インストール,ファイルインポート編)

More than 1 year has passed since last update.

QIIME 2 を使う.

QIIME2 はDNAのシーケンスデータから微生物解析を行うためのオープンソースのパイプラインである.クオリティの高いグラフや統計の処理を行うことが可能である.

AT 2017 Advent Calendar のネタ用に書きました!ぜひやってみてね!

QIIME 2 のインストール

1. QIIME 2 コア 2017.12 distribution

QIIME 2 には以下のコマンドラインインターフェースが内蔵されている.
q2-alignment
q2-composition
q2-cutadapt
q2-dada2
q2-deblur
q2-demux
q2-diversity
q2-emperor
q2-feature-classifier
q2-feature-table
q2-gneiss
q2-longitudinal
q2-metadata
q2-phylogeny
q2-quality-control
q2-quality-filter
q2-sample-classifier
q2-taxa
q2-types
q2-vsearch

2. Miniconda のインストールする

Miniconda はQIIME 2 をインストールするための推奨方法なので,先にMiniconda をインストールする.
ちなみにMiniconda 2,3 のどちらでもよい(つまりPython 2,3の両方可).

conda install conda=4.3

3. QIIME 2 を Miniconda でインストールする

MacOS/OS X (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-osx-64.txt

Linux (64bit)の場合

conda create -n qiime2-2017.12 --file https://data.qiime2.org/distro/core/qiime2-2017.12-conda-linux-64.txt

4. QIIME 2 を起動する

source activate qiime2-2017.12

QIIME 2 にFastq ファイルをインポートする

今回は,ペアエンドであるL2S357_15_L001_R1_001.fastq.gzL2S357_15_L001_R2_001.fastq.gzなどの形式のfastq ファイルをQIIME 2 にインポートしてみる.

1. paired-end demultiplexed fastq(テストデータ)をダウンロードする

wget -O "casava-18-paired-end-demultiplexed.zip" "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

# または

curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/casava-18-paired-end-demultiplexed.zip" > "casava-18-paired-end-demultiplexed.zip"

# ファイルを解凍する
unzip -q casava-18-paired-end-demultiplexed.zip

2. fastq ファイルをインポートする

--input path には解凍したディレクトリ, --output-path には出力するqza ファイルの名前を指定する.
QIIME 2 では,qza ファイルにさまざまな入力データを保存する必要がある.

qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path casava-18-paired-end-demultiplexed \
  --source-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-paired-end.qza

manifest ファイルを使って指定したいときは,--input-path にmanifest ファイルを指定する.
https://docs.qiime2.org/2019.1/tutorials/importing/

3. サマライズを行う

これを行うことにより,サンプルごとに取得された配列の数を確認することができる.また,シーケンスの配列クオリティの要約も得ることができる.

qiime demux summarize \
  --i-data demux-paired-end.qza \
  --o-visualization demux-paired-end.qzv

BIOM ファイルをインポートする

QIIME 1 で作成されたBIOM ファイルもQIIME 2 にインポートすることができる.

1. BIOM v2.1.0 フォーマット(テストデータ)をダウンロードする

wget -O "feature-table-v210.biom" "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom"
# または
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/feature-table-v210.biom" > "feature-table-v210.biom"

2. BIOM ファイルをインポートする

qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV210Format \
  --output-path feature-table-2.qza

アライメントされていないfna ファイルをインポートする

1. fna ファイルをダウンロードする

wget -O "sequences.fna" "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna"
# or
curl -sL "https://data.qiime2.org/2017.12/tutorials/importing/sequences.fna" > "sequences.fna"

2. fna ファイルをインポートする

qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'

3. fna ファイルをアライメントする

mafft を用いてアライメントを行う.

qiime alignment mafft \
  --i-sequences rep-seqs.qza \
  --o-alignment aligned-rep-seqs.qza

次回以降は, 読み込んだfastq ファイルのクオリティコントロール,Feature Table の生成の方法を書く予定です.

kohei-108
微生物研究をしています。微生物多様性を高めて、健康な都市を創ります!慶應SFCでゲノム解析論文を複数投稿、世界を変える30人 Forbes 30UNDER30 Japan 受賞、Tokyo Startup Gateway 2020 最優秀賞、SONY U24 CO-CHALLENGE 2020 準グランプリなど。UVERworldを心から愛しています!
https://profiee.com/i/koheiito
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away