Clara Parabricks V4.0を利用する
Clara Parabricksのhaplotypecallerツール
haplotypecaller
はリファレンス配列にマップされたリードからVariantをするツール
解析のためのデータとして次のファイルを準備する
- リファレンス配列とそのindex
- 解析対象となるbamファイル
- BQSR のデータファイル
- 解析対象の領域を指定するファイル(インターバル形式またはbed形式)
Clara Parabricks4.0を利用するその1に引き続いて処理を行う事を想定し
前回の結果に基づいて解析対象のサンプル名はsample
としている
$ export SAMPLE="sample"
として
下記のスクリプトを実行
docker run \
--gpus all \
-u `id -u`:`id -g` \
--rm \
--volume ${PWD}/reference:/reference \
--volume ${PWD}/variant:/variant \
--volume ${PWD}/parabricks_sample/Data:/fastq \
--volume ${PWD}/Parabricks4.0:/outputdir \
--workdir /tmp \
nvcr.io/nvidia/clara/clara-parabricks:4.0.0-1 \
pbrun haplotypecaller \
--ref /reference/GCA_000001405.15_GRCh38_no_alt_analysis_set.fna \
--in-bam /outputdir/${SAMPLE}.bam \
--interval-file /reference/region.bed \
--in-recal-file /outputdir/${SAMPLE}.BQSR-report.txt \
--out-variants /outputdir/${SAMPLE}.vcf
sample.vcf
が作成される
gvcfファイルを作成する必要がある場合には--out-variants
の拡張子部分を.gvcf
とすること
今回はここまで