#はじめに
前回のphyloseqオブジェクトの記事で解析後のサンプルのrarefy(希釈)について少し、触れました。rarefyを行うことで、サンプルごとのリード数のばらつきを揃えることができます。しかし、その希釈によって、各サンプルの種(OTU)の数に影響が出てしまうような場合、最小リード数が小さすぎるなどの理由により、適切な希釈が出来ていないとみなされます。なのでrarefyに使用した最小リード数が本当に適切な値であるか、見極める必要があります。
#alpha rare fraction curve とは
alpha rare fraction curveは縦軸をOTUのカウント数、横軸をリード数としてグラフを描いたものです。下に例を載せていますが、希釈のために用いたリード数が小さすぎた場合には、希釈の影響によって、カウントできるOTUの数が減ってしまいます。一方、一定値以上(下図の場合20000程度)のリード数を読み込むことで、OTUを減らすことなくサンプルの希釈が出来ていることを確認することが出来ます(下図のサンプルの最小リード数は40000程度でした)。
#さっそく描いてみよう(R)
微生物系の論文ではalpha rare fraction curveの図を補足として載せているものが多いです。今回はPhyloseqを使って2通りの書き方を試してみました。phyloseqにはrarefyする前のOTUテーブルを使っています。
##使ったパッケージ
library(phyloseq)
library(ggplot2)
library(vegan)
library(dplyr)
##方法1
計算を要しないのですぐにグラフが書けるが、サンプル名が消し方がわからない。
physeq %>%
otu_table() %>%
t() %>%
vegan::rarecurve(step = 1000)#希釈に用いるリード数を1000ずつ変えてプロット
##方法2
ggrareで計算してくれる方法。グラフはきれいだが計算に時間がかかる。
theme_set(theme_bw())
p <- ggrare(physeq, step = 1000)
#参考URL
① https://southgreenplatform.github.io/trainings/linux/metabarcodingPractice/
② https://raw.githubusercontent.com/mahendra-mariadassou/phyloseq-extended/master/load-extra-functions.R