Clara Parabricks V4.0を利用する

Clara Parabricksのhaplotypecallerツール

haplotypecallerはリファレンス配列にマップされたリードからVariantをするツール

解析のためのデータとして次のファイルを準備する

リファレンス配列とそのindex
解析対象となるbamファイル
BQSR のデータファイル
解析対象の領域を指定するファイル(インターバル形式またはbed形式)

Clara Parabricks4.0を利用するその1に引き続いて処理を行う事を想定し

前回の結果に基づいて解析対象のサンプル名はsampleとしている

$ export SAMPLE="sample"

として

下記のスクリプトを実行

docker run \
    --gpus all \
    -u `id -u`:`id -g` \
    --rm \
    --volume ${PWD}/reference:/reference \
    --volume ${PWD}/variant:/variant \
    --volume ${PWD}/parabricks_sample/Data:/fastq \
    --volume ${PWD}/Parabricks4.0:/outputdir \
    --workdir /tmp \
    nvcr.io/nvidia/clara/clara-parabricks:4.0.0-1 \
    pbrun haplotypecaller \
    --ref /reference/GCA_000001405.15_GRCh38_no_alt_analysis_set.fna \
    --in-bam /outputdir/${SAMPLE}.bam  \
    --interval-file /reference/region.bed \
    --in-recal-file /outputdir/${SAMPLE}.BQSR-report.txt \
    --out-variants /outputdir/${SAMPLE}.vcf

sample.vcfが作成される

　gvcfファイルを作成する必要がある場合には--out-variantsの拡張子部分を.gvcfとすること

今回はここまで

Clara Parabricks4.0を利用する その2

Clara Parabricks V4.0を利用する

Clara Parabricksのhaplotypecallerツール

Clara Parabricks4.0を利用する　その2