Windows 10 のPower shellからannovarを実行するときのメモ
・PerlはWindowsに標準ではインストールされていない
・Active Perlというのがメジャーらしい
というわけで、Active Perlをインストールする。公式サイトからCommunity Editionをダウンロードしてインストールする。Environment VariableにPathを通すかどうか聞かれるが、これはYesにしておく。
Annovarをダウンロードして適当なフォルダに展開しておく。
PowerShellを起動して、ディレクトリを移動
cd /PATH_TO/annovar/
以降は下記コマンドを実行していく。
official siteに詳細なドキュメントがある。
サンプルファイルをアノテーションしてみる。annotate_variation.plでのアノテーションは
・データベースファイルのダウンロード(遺伝子情報そのものと、アレル頻度の情報)
・.vcfファイルの.avinputへの変換
・アノテーション
の三つの段階に分かれる。
データベースのダウンロード
データベースファイルのダウンロードを行う。ブロードバンドでも数十分かかる。
perl ./annotate_variation.pl -buildver hg19 -downdb -webfrom annovar refGene humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb cytoBand humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb genomicSuperDups humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb -webfrom annovar esp6500siv2_all humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb -webfrom annovar 1000g2014oct humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb -webfrom annovar snp138 humandb/
perl ./annotate_variation.pl -buildver hg19 -downdb -webfrom annovar ljb26_all humandb/
ファイルフォーマットの変更
annovar/example内に3つの変異の情報を含んだex2.vcfというサンプルファイルがある。
これをconvert2annovar.plを用いて.avinputファイルに変換する。
perl ./convert2annovar.pl -format vcf4 ./example/ex2.vcf > ./example/ex2.avinput
変異のアノテーション
.avinputファイルについて、annotate_variationを用いてアノテーションを行う。上記で作成したex2.avinputは複数サンプルのデータが含まれているため、今回はサンプルが一つだけのex1.avinputを用いた。
.\annotate_variation.pl example\ex1.avinput humandb -build hg19 -out ex1 --dbtype refGene
以下の三つのファイルができる。
ex1.variant_function:すべて変異情報
ex1.exonic_variant_function:エクソン上の変異情報(翻訳への影響を含む)
ex1.invalid_input:うまくアノテーションできなかった変異情報
というわけでwindowsでAnnovarが動いたが、正直なところUNIXでやったほうがよっぽど良い。