はじめまして.私は魚類のゲノム編集に関する研究を普段行っています.
NGS解析については完全に素人だったのですが,RNA-SeqによるDRY解析ができたらと思って手を出してみましたが,環境構築でつまづいてしまい1年ほど放置していました.
実験の類が少しひと段落したので,とりあえず重い腰をあげてDRY解析に乗り出しました.
この記事は普段WETラボで実験に追われている人のためにRNA-Seqを一通りやってみたという記事です(ほとんど自分用のメモです).
#シリーズの見出し
1, 環境構築(今回)
2, マッピングと発現量算出
レファレンスのある生物種におけるhisat2,STARを用いたマッピング,stringtie,kallisto,salmonを用いたリードカウント(定量)
3, 遺伝子発現量変動解析
得られた発現量をもとに各種解析を行う
4,de novo アセンブリによる発現量算出
リファレンスのない生物種でde novo asemblyを行って発現定量を行う
5,リファレンスのない生物種における遺伝子類似性検索
得られたアセンブリを利用して近縁種との遺伝子/アミノ酸配列の類似性検索を行う
##0 マシンスペック
Macbook Pro (16inch, 2019)
CPU 2.3GHz 8core (Intel Core i9)
memory 32GB 2267Hz DDR4
storage 2TB
#1 環境構築
流れ
マシン初期化(よくわからないものが入っていたので,,)
macの動作についての環境設定(以前意外とmacOSの動作で悩まされることが多かったので)
各種ツールの導入(主にminiconda経由でインストール)
*環境構築めっちゃ大事!特にanacondaとかややこしいツールと競合して環境が壊れることがあるので最初にどういうセットアップしたかメモっておくの大切だと思う.
##1.0 マシンの初期化
https://support.apple.com/ja-jp/HT201065
を参考に初期化
システム終了,option command ,P,Rを同時押し
すぐにOS外の復旧画面(ネットワーク設定画面)が表示,ネットワークに接続(約15分待機)
macOS復旧画面が表示される→ディスクユーティリティ,Macintosh HDを消去,ディスクユーティリティを終了
macOS Big Surを再インストール(約40分)
各種設定,appleIDはあとで設定,
##1.1 macbookpro各種環境設定
###1.1.1 トラックパッド
システム環境設定-トラックパッド-タップでクリックに☑️(使いやすい)
###1.1.2 スリープさせない
システム環境設定-バッテリー でディスプレイをオフにするのバーを「しない」に設定
電源アダプタ ででディスプレイをオフにするのバーを「しない」に設定
「ディスプレイがオフのとき自動でスリープさせない」に☑️
システム環境設定-デスクトップとスクリーンセーバーでスクリーンセーバーをオフにする
*PCがスリープすると解析が止まってしまう
###1.1.3 自動スペル変換をオフに
環境設定-キーボード-ユーザ辞書でスペル自動変換/自動大文字/自動ピリオド/スマート引用符を全てオフ
環境設定-キーボード-入力ソースでライブ変換/タイプミス修正をオフ
*コーディングの時に余計な自動変換がめっちゃストレスなので
###1.1.4 terminal環境設定
ターミナルを開く,環境設定-プロファイル-フォントでフォントサイズを11→18に変更
環境設定-一般-開くシェル-コマンドで/bin/bash と打ち込む
ターミナルを開きbashになってるか確認
*上のuser名のあとがbashに,かつデフォルトのシェルはzshですので戻すにはchsh -s /bin/zsh
を実行してくださいのメッセージが出たらbashシェルに変更されている!
これで開くシェルがzshからbashに変更された,macOSは catalinaからzshを採用しているが多くのソフトウェアはbashで動く想定なのでPATHがうまく通らないことがあるらしい,実際にzshではanacondaのcondaコマンドが作動しなかった
###1.1.5 コマンドライン ディベロッパツールのインストール
ターミナルを開き,xcode-select --install
と打ち込む,GUI操作でインストール
###1.1.6 safariのダウンロード設定
safariを開き、環境設定-一般の最下のダウンロード後安全なファイルを開くをオフにする
*これがONであると、勝手に圧縮ファイルが解凍されて情報落ちが発生する場合がある、特に生データの.gzファイルの取り扱いには注意。圧縮状態で保管するのがよい
##1.2 Rのインストール
RをCRAN(https://cran.ism.ac.jp ) からダウンロードする,latestの最新バージョン(R-4.1.0.pkg)
pkgファイルを開き,インストーラーを使ってインストール
##1.3 homebrewのインストール
https://brew.sh/index_ja で指定されているコマンドをターミナルで実行
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
上記が2021.07.05 時点でのコマンド
*完了するまで触らない
brew doctor
を実行
unexpected dylibs やunbrewed fileが出てきたので削除(rm -rf "filename"
を実行)
brew doctor
再度実行→Your system is ready to brew.と表示された!
brew update
を実行して最新であることを確認
##1.4 wgetのインストール
brew install wget
でインストール
##1.5 minicondaのインストール
###1.5.1 minicondaインストール
minicondaのHP(https://docs.conda.io/en/latest/miniconda.html )へ
Miniconda3 MacOSX 64-bit bash
Miniconda3 MacOSX 64-bit pkg
の2つがあるが無印pkg版をダウンロード,インストーラーを使用
conda activate
を実行
minicondaの各channelsを設定する
conda config --add channels defaults
conda config --add channels bioconda
conda config --add channels conda-forge
*defaultsはalreadyなんとかになってた
*必ずこの順番で配置する(優先順位がある)
###1.5.2 bioinformatics系ツールをインストールしてみる
SRA Toolkit
conda install -c bioconda sra-tools
Trim galore!
conda install -c bioconda trim-galore
kallisto
conda install -c bioconda kallisto
*環境構築ではとりあえずこれくらい,あとは必要になったら適宜いれていく
*trinityはconda, homebrew, pkgインストーラーなどで入れない,Dockerを使って別環境で実行する
#次回はテストデータを用いて生データからトリミング,QC,マッピング(アセンブリ),発現定量までを行う