docker image
$ docker pull ubuntu:18.04
コンテナの起動
8080と8787のポートを解放しておく。Rstudio-serverを使用する際、8787を使用する。
$ docker run -it -d -p 8080:8080 -p 8787:8787 ubuntu:18.04
コンテナ内に入り、aptをアップデートし、curlおよびRのインストール。r-recommendedはCRANにある有用なRパッケージに依存するメタパッケージである。
$ apt update
$ apt install curl
$ apt install r-recommended
Rstudio-serverをインストールするために以下のコマンドを実行していく。
$ apt install gdebi-core
$ curl -O https://download2.rstudio.org/server/bionic/amd64/rstudio-server-1.2.5019-amd64.deb
$ gdebi rstudio-server-1.2.5019-amd64.deb
Rstudioがインストールが終わった後はユーザー登録が必要。
パスワード以外は空白で問題ない。
$ adduser rstudio
Adding user `rstudio' ...
Adding new group `rstudio' (1001) ...
Adding new user `rstudio' (1001) with group `rstudio' ...
Creating home directory `/home/rstudio' ...
Copying files from `/etc/skel' ...
Enter new UNIX password:
Retype new UNIX password:
passwd: password updated successfully
Changing the user information for rstudio
Enter the new value, or press ENTER for the default
Full Name []:
Room Number []:
Work Phone []:
Home Phone []:
Other []:
Is the information correct? [Y/n]
ローカルマシンのブラウザから http://localhost:8787/ にログインすればRstudioに入れる
minicondaのインストール
$ curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
$ sh Miniconda3-latest-Linux-x86_64.sh
$ conda config --add channels defaults
$ conda config --add channels conda-forge
$ conda config --add channels bioconda
FastQCとJAVAのインストール
/user/local/lib/
配下にFastQC
とjava
をインストールしてくる。
それぞれの実行ファイルのシンボリックリンクを/user/local/bin
に置く。
ln -s /user/local/lib/FastQC/ /user/local/bin
GATK HaplotypeCaller
Realignmentは
GATK HaplotypeCallerや
MuTect2を使用すれば
必要ないということで、
GATK3.6から非推奨項目に・・・。
アノテーションツール
SnpEff ・・・ 高性能なアノテーションツール。ヒト以外にも対応。
trimming
Trimmomatic は,Illumina 最新式のシーケンサーから得られたデータの解析に不向きなようです.Trimmomatic は 4 色式で得られたデータ用のトリミングツールなので,Novaseq や NextSeq など,最新の 2 色式で算出されたデータの解析には適していないそうです.
####fastp
#bioconda
conda install -c bioconda -y fastp
-
-i
: ペアエンドのread1 -
-0
: ペアエンドread1の出力先 -
-I
: ペアエンドのread2 -
-O
: ペアエンドのread2の出力先 -
-h
: レポートファイル(html)の出力先 -
-q, --qualified_quality_phred
: 満たすべきクオリティスコア(phred)。15がデフォルト値。 -
-u, --unqualified_percent_limit
:-q
で設定した閾値を下回る塩基の許容割合。デフォルト値40。 -
-n
: 塩基Nの数の許容数。これを越えると、そのリードは破棄される。 -
-3, --cut_tail
: 3'末端から前方へ向かってウィンドウをスライドさせる。ウィンドウ内の平均がcut_mean_quality
よりも低くなるとその塩基をcutする。デフォルトでは無効になっている。 -
cut_right_window_size
: デフォルト値は4。 -
cut_right_mean_quality
: デフォルト値は20。 -
-w
: thread数。 -
-A
: アダプタートリミングの無効化。デフォルトではアダプタートリミングが有になっている。
fastqファイルの連結
cat [sample_f1.fastq.gz] [sample_f2.fastq.gz] [sample_f3.fastq.gz].... > [sample_f.fastq.gz]
参考にしたサイト
Rstudio-server
R による分析環境構築 (RStudio Server)
https://inamuu.com/docker-compose%E3%81%A7%E3%82%B3%E3%83%B3%E3%83%86%E3%83%8A%E3%81%8C%E8%B5%B7%E5%8B%95%E3%81%97%E3%81%AA%E3%81%84/
https://amalog.hateblo.jp/entry/data-analysis-docker
amerief