初心者によるやってみた系の記事です。
IBD(炎症性腸疾患 クローン病・潰瘍性大腸炎)のGWASのデータをつかってマンハッタンプロットを描いてみます。
ありがたいことに、International Inflammatory Bowel Disease Genetics Consortium (IIBDGC)のサイトがGWASのメタアナリシスのデータをP値付きで公開しています。これを使用します。
https://www.ibdgenetics.org/

ダウンロードしたら、解凍します。
RをRstuioなどで起動して、タブ区切りファイルをデータフレームに読み込みます。
ibd <- read.table("EUR.IBD.gwas_info03_filtered.assoc", header=TRUE)
crohn <- read.table("EUR.CD.gwas_info03_filtered.assoc", header=TRUE)
uc <- read.table("EUR.UC.gwas_info03_filtered.assoc", header=TRUE)
簡単なのですが、それぞれのファイルは約1GBあり、読み込みだけでも時間がかかります。
ノートPC等で実行する場合はhtop
でメモリ使用量を監視した方がいいかもしれません。
qqman
こちらで使い方が説明されています(公式)
https://cran.r-project.org/web/packages/qqman/vignettes/qqman.html
解析で有名なアメリエフのブログでも使い方が紹介されています。
https://staffblog.amelieff.jp/entry/2018/05/15/173432
library(qqman)
manhattan(ibd, main = "IBD Manhattan Plot", cex = 0.3, col = c("blue4", "orange3"))
manhattan(crohn, main = "CD Manhattan Plot", cex = 0.3, col = c("blue4", "orange3"))
manhattan(uc, main = "UC Manhattan Plot", cex = 0.3, col = c("blue4", "orange3"))
デフォルトだと、すこしドットのサイズが大きくなるので、cex=0.3
を指定して小さくしてみました。色は、チュートリアルに倣って、ブルーとオレンジのシマシマにしました。
(一つのグラフの描写に30分ぐらい時間がかかります)
<不平衡の話>
QQプロットも描いてみましょう。
qq(ibd$P, main = "IBD")
qq(crohn$P, main = "CD")
qq(uc$P, main = "UC")
CMplot
https://github.com/YinLiLin/R-CMplot
CMプロットは、どうやら、データフレームの列を所定の順番に認識しているようなので、順番通りに並び替えます。オプションをつけないで実行するとこんな感じですね。
library(CMplot)
ibd2 <- ibd[,c("SNP", "CHR", "BP", "P")]
CMplot(ibd2)
IBD




Crohn




UC




この記事は以上ですが、IBDデータのシリーズはもう少し続く予定です。