single cellのalignment toolで10X社が提供しているCellRangerのセットアップと解析を行う。
Ubuntuを使う。
まずは、スペックの確認。
以下が、要求スペック。
Cell Ranger pipelines run on Linux systems that meet these minimum requirements:
8-core Intel or AMD processor (16 cores recommended)
64GB RAM (128GB recommended)
1TB free disk space
64-bit CentOS/RedHat 6.0 or Ubuntu 12.04
自分のを調べるためには、
CPUmodel
grep -m 1 'model name' /proc/cpuinfo
CPUcore
grep -c processor /proc/cpuinfo
Memorytotal
grep MemTotal /proc/meminfo
storage
df -Ph
次に、10X社のページからソフトとリファレンスをダウンロードする。
https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
mkdir cellranger_downloads
cd cellranger_downloads
#cellrangerのダウンロード
wget -O "10Xのページからcellrangerのリンクをコピー"
#referenceのダウンロード
wget -O "mouseかhumanのreferenceが必要ならリンクをコピーしてダウンロード"
ここからは、https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/installation
に沿ってinstall
#referenceの解凍
cd /opt
sudo tar -xzvf ~/cellranger_downloads/refdata-gex-GRCh38-2020-A.tar.gz
sudo tar -xzvf ~/cellranger_downloads/cellranger-6.1.2.tar.gz
#PATHのexport
export PATH=/opt/cellranger-6.1.2:$PATH
#testrun
cellranger testrun --id=tiny
...
Pipestance completed successfully!
...
#結果の確認。うまくいっているとoutsやsc_RNA_COUNTER_CSなどが出力されている。
#ls tiny/
...
SC_RNA_COUNTER_CS outs
...
ここから実際のサンプルを使って実行。
fastqファイルは以下のような階層になっている。
referenceは上でダウンロードしてきた10Xが提供してくれているものをありがたく使う。
(自分で作るとまぁまぁ時間かかる。)
CONTROL_fastqs
├── CONT_S1_L007_I1_001.fastq.gz
├── CONT_S1_L007_I2_001.fastq.gz
├── CONT_S1_L007_R1_001.fastq.gz
├── CONT_S1_L007_R2_001.fastq.gz
cellranger count --id=test --fastqs=/PATH/CONTROL_fastqs/ --sample=CONT --transcriptome=/opt/refdata-gex-GRCh38-2020-A/
--idは好きな名前をつければ良い。
--fastqsでfastqが入っているdirectoryまでのpathを指定。
--sampleは_S1の前の部分までを指定。
--transcriptomeはreferenceのdirectoryを指定。
あとは待つのみ。松の実。
しばらくほっとくと、結果が出力される。
/test/outs/filtered_feature_bc_matrix
├── barcodes.tsv.gz
├── features.tsv.gz
└── matrix.mtx.gz
これをRに持っていってSeuratで解析(また次の機会)。