2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Dockerでバイオインフォ環境構築(執筆中)

Last updated at Posted at 2019-12-10

docker image

$ docker pull ubuntu:18.04

コンテナの起動

8080と8787のポートを解放しておく。Rstudio-serverを使用する際、8787を使用する。
$ docker run -it -d -p 8080:8080 -p 8787:8787 ubuntu:18.04

コンテナ内に入り、aptをアップデートし、curlおよびRのインストール。r-recommendedはCRANにある有用なRパッケージに依存するメタパッケージである。

container
$ apt update
$ apt install curl
$ apt install r-recommended

Rstudio-serverをインストールするために以下のコマンドを実行していく。

container
$ apt install gdebi-core
$ curl -O https://download2.rstudio.org/server/bionic/amd64/rstudio-server-1.2.5019-amd64.deb
$ gdebi rstudio-server-1.2.5019-amd64.deb

Rstudioがインストールが終わった後はユーザー登録が必要。
パスワード以外は空白で問題ない。

container
$ adduser rstudio
Adding user `rstudio' ...
Adding new group `rstudio' (1001) ...
Adding new user `rstudio' (1001) with group `rstudio' ...
Creating home directory `/home/rstudio' ...
Copying files from `/etc/skel' ...
Enter new UNIX password: 
Retype new UNIX password: 
passwd: password updated successfully
Changing the user information for rstudio
Enter the new value, or press ENTER for the default
    Full Name []: 
    Room Number []: 
    Work Phone []: 
    Home Phone []: 
    Other []: 
Is the information correct? [Y/n] 

ローカルマシンのブラウザから http://localhost:8787/ にログインすればRstudioに入れる

minicondaのインストール

$ curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
$ sh Miniconda3-latest-Linux-x86_64.sh

$ conda config --add channels defaults
$ conda config --add channels conda-forge
$ conda config --add channels bioconda

FastQCとJAVAのインストール

/user/local/lib/配下にFastQCjavaをインストールしてくる。
それぞれの実行ファイルのシンボリックリンクを/user/local/binに置く。

ln -s /user/local/lib/FastQC/ /user/local/bin

GATK HaplotypeCaller

Realignmentは
GATK HaplotypeCallerや
MuTect2を使用すれば
必要ないということで、
GATK3.6から非推奨項目に・・・。

アノテーションツール

SnpEff ・・・ 高性能なアノテーションツール。ヒト以外にも対応。

trimming

Trimmomatic は,Illumina 最新式のシーケンサーから得られたデータの解析に不向きなようです.Trimmomatic は 4 色式で得られたデータ用のトリミングツールなので,Novaseq や NextSeq など,最新の 2 色式で算出されたデータの解析には適していないそうです.

####fastp

#bioconda
conda install -c bioconda -y fastp
  • -i : ペアエンドのread1
  • -0 : ペアエンドread1の出力先
  • -I : ペアエンドのread2
  • -O : ペアエンドのread2の出力先
  • -h : レポートファイル(html)の出力先
  • -q, --qualified_quality_phred : 満たすべきクオリティスコア(phred)。15がデフォルト値。
  • -u, --unqualified_percent_limit : -qで設定した閾値を下回る塩基の許容割合。デフォルト値40。
  • -n : 塩基Nの数の許容数。これを越えると、そのリードは破棄される。
  • -3, --cut_tail : 3'末端から前方へ向かってウィンドウをスライドさせる。ウィンドウ内の平均がcut_mean_qualityよりも低くなるとその塩基をcutする。デフォルトでは無効になっている。
  • cut_right_window_size : デフォルト値は4。
  • cut_right_mean_quality : デフォルト値は20。
  • -w : thread数。
  • -A : アダプタートリミングの無効化。デフォルトではアダプタートリミングが有になっている。

fastqファイルの連結

cat [sample_f1.fastq.gz] [sample_f2.fastq.gz] [sample_f3.fastq.gz].... > [sample_f.fastq.gz]

参考にしたサイト

Rstudio-server
R による分析環境構築 (RStudio Server)
https://inamuu.com/docker-compose%E3%81%A7%E3%82%B3%E3%83%B3%E3%83%86%E3%83%8A%E3%81%8C%E8%B5%B7%E5%8B%95%E3%81%97%E3%81%AA%E3%81%84/
https://amalog.hateblo.jp/entry/data-analysis-docker
amerief

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?