plinkのpcaを用いて1000人ゲノムプロジェクトのミトコンドリアdnaのsnpの主成分分析を行いたい
解決したいこと
plinkのpcaを用いて1000人ゲノムプロジェクトのミトコンドリアdnaのsnpの主成分分析を行いたいです。
1000人ゲノムプロジェクトのftpサイトから、以下のリンクにアクセスし、ダウンロードしたvcfファイルから、--make-bedコマンドを実行して「ALL.mt.bed」というbedファイルを生成しました。
このbedファイルを用いて主成分分析を行うコマンド「plink --bfile ALL.mt --pca header --out qcvcf」を実行すると、フィルタリングによって全てのsnpが弾かれてしまい、エラーが発生しました。このエラーについて、対処法を伺いたいです。
発生している問題・エラー
↓エラーコードまでのログ↓
PLINK v1.90b6.21 64-bit (19 Oct 2020)
Options in effect:
--bfile ALL.mt
--out qcvcf
--pca 3 header
Hostname: hw20a028
Working directory: /Users/hw20a028/Desktop/卒業研究/mt
Start time: Fri Feb 17 16:39:36 2023
Random number seed: 1676619576
8192 MB RAM detected; reserving 4096 MB for main workspace.
3892 variants loaded from .bim file.
2534 people (0 males, 0 females, 2534 ambiguous) loaded from .fam.
Ambiguous sex IDs written to qcvcf.nosex .
Using up to 8 threads (change this with --threads).
Before main variant filters, 2534 founders and 0 nonfounders present.
Calculating allele frequencies... done.
Total genotyping rate is 0.999843.
3892 variants and 2534 people pass filters and QC.
Note: No phenotypes present.
Excluding 3892 variants on non-autosomes from relationship matrix calc.
↓エラーコード↓
Error: No variants remaining.
自分で試したこと
pcaのオプションを色々調べたが、フィルタリングの設定を変更するコマンドが見つからなかった
pythonで主成分分析を行おうとしたが、データの前処理のやり方がわからなかった。