hw20a028
@hw20a028 (kazuki okuno)

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

plinkのpcaを用いて1000人ゲノムプロジェクトのミトコンドリアdnaのsnpの主成分分析を行いたい

解決したいこと

plinkのpcaを用いて1000人ゲノムプロジェクトのミトコンドリアdnaのsnpの主成分分析を行いたいです。

1000人ゲノムプロジェクトのftpサイトから、以下のリンクにアクセスし、ダウンロードしたvcfファイルから、--make-bedコマンドを実行して「ALL.mt.bed」というbedファイルを生成しました。

リンク:http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/ALL.chrMT.phase3_callmom-v0_4.20130502.genotypes.vcf.gz

このbedファイルを用いて主成分分析を行うコマンド「plink --bfile ALL.mt --pca header --out qcvcf」を実行すると、フィルタリングによって全てのsnpが弾かれてしまい、エラーが発生しました。このエラーについて、対処法を伺いたいです。

発生している問題・エラー

↓エラーコードまでのログ↓

PLINK v1.90b6.21 64-bit (19 Oct 2020)
Options in effect:
--bfile ALL.mt
--out qcvcf
--pca 3 header

Hostname: hw20a028
Working directory: /Users/hw20a028/Desktop/卒業研究/mt
Start time: Fri Feb 17 16:39:36 2023

Random number seed: 1676619576
8192 MB RAM detected; reserving 4096 MB for main workspace.
3892 variants loaded from .bim file.
2534 people (0 males, 0 females, 2534 ambiguous) loaded from .fam.
Ambiguous sex IDs written to qcvcf.nosex .
Using up to 8 threads (change this with --threads).
Before main variant filters, 2534 founders and 0 nonfounders present.
Calculating allele frequencies... done.
Total genotyping rate is 0.999843.
3892 variants and 2534 people pass filters and QC.
Note: No phenotypes present.
Excluding 3892 variants on non-autosomes from relationship matrix calc.

↓エラーコード↓

スクリーンショット 2023-02-17 16.51.53.png

Error: No variants remaining.

自分で試したこと

pcaのオプションを色々調べたが、フィルタリングの設定を変更するコマンドが見つからなかった
pythonで主成分分析を行おうとしたが、データの前処理のやり方がわからなかった。

0

No Answers yet.

Your answer might help someone💌