はじめまして。
バイオインフォマティクス初心者のsakiです。
しかもPCが得意でない・・・
そんな私ですが、最近circRNAなるものの同定(予測?)がバイオインフォマティクに行われていることを知り、「自分でもやってみたい 」と一念発起。
私のPCはスペックがイマイチなため、Google Colabolatoryでなんとか奮闘したいと思います。
これから奮闘記を残していきたいと思っています。
素人のガバガバスキルであるため、「こうすればいい」、「ああすればより良い」、「これはまずい」などご意見あれば、ご教授ください。
circRNAの同定に使えるツールを調べてみた
まずは下調べ。
circularRNAって?
non-coding RNAの一種ということですが、翻訳されるものもあるよう。通常のスプライシングとは逆方向へスプライシングが起き(3'→5'へのバックスプライス)た結果、形成される環形のRNAだそうです。
circRNAの同定に使えるツール
find_circ, CIRCexplore, CIRCexplore2, findcircRNAなどがあります。
de novo解析が可能なアルゴリズムもあるようですが、今回はreference配列を用いた同定を行っていきたいと覆います。どこかでつまづくこともあると思うので、いくつかのpipelineを使ってみたいと思います。
まずは、circRNAFinderを使ってみます。
.git/Tutorial.shのコードにある指示を追っていけば何とかできそうな気がします。
使用環境を整える
circRNAFinderを使ったはいいのですが、その前にちゃんと動作環境を見とくべきだったな、と反省。なぜ見なかったのか、と後々悔やまれました。
というのも、circRNAFinderはpython2ベースのpipelineで、google Colaboは2020年初頭にpython2のサポートを終了していたからです。
以降は、途中までcircRNAFinderを使う体で書いてます。ただ、他のツールを使うとしても同様の作業が必要となってくると思われるので、備忘録として残しています。
google driveの容量を増やす
Tutrial.sh内で使用しているSRAデータを見ると、デフォルトの容量では足りなさそうなので、3か月間は安かったこともあり、200 GBに容量を増量することにしました。
google colabolatoryにgoogle driveをマウント
gitをクローンして、そのフォルダをdrive内に入れたいと思ったので、まずはdriveをマウントしました。
from google.colab import drive
drive.mount('/content/drive')
bashを使えるようにする
python以外の言語を使うことも多いので、bash-kernelを追加することにしました。
(必ずしもインストールする必要はなく、冒頭に%%bash
を付ければbashを起動させることができます。)
こちらのサイト様を参考にしました。
note.nkmk.me
#bashの追加
!pip install bash_kernel
!python -m bash_kernel.install
biocondaをinstall
git hub以外でもbioconda経由でプログラムをインストールできたら楽だと思い、biocondaをインストールしました。ついでに、.sraや.fastaqをダウンロードしたり、pair-endのfastqをsplitするのに便利かなと思い、sra toolkit
もインストールしました
#minicondaのインストール
!wget https://repo.continuum.io/miniconda/Miniconda3-py38_4.8.3-Linux-x86_64.sh && bash Miniconda3-py38_4.8.3-Linux-x86_64.sh -bfp /usr/local
!conda config --add channels conda-forge
!conda config --add channels bioconda
#sra-toolsのインストール
!conda install -c bioconda sra-tools -y
gitをクローンする
circRNAFinderのgitをクローンしました。
!git clone https://github.com/bioxfu/circRNAFinder.git
カレントディレクトリを変更
クローンしたgitはgoogle Drive > My drive内に移動させました。この作業の前にカレントディレクトリをMy driveに移動させていれば良かったと反省しています。
bashを使用してのカレントディレクトリの変更ができなかったため、pythonを使って変更しました。
os.chdir('/content/drive/MyDrive')
print(os.getcwd())
とりあえず準備は終わり
ここまででとりあえず、実行環境は整えられたかなと思います。次回は材料集めをしていきます。