0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Google colaboratoryを用いて遺伝子クラスター比較ソフトclinkerを動かす

Last updated at Posted at 2022-06-02

Clinkerは遺伝子クラスターの比較図を簡単に出力してくれるバイオインフォマティクス用のツールです。
非常に見やすく、遺伝子比較図を出力することができるので有用なツールです。

一方で、PCが苦手な人には扱いにくいかもしれません。
google colaboratry 利用して比較的簡単に動作させることができるので、初心者も利用してみるといいと思います。

Google colaboratoryを開きコードセルを追加します。
最初のセルに

!pip install clinker

と入力し実行します。
するとclinkerのインストールが始まります。

2022年11月21日現在、biopythonをv18.0にアップデートすると動作しないようです。
以下の操作でダウングレードします。

!pip install biopython==1.79

次に比較に使いたいgenbankファイルをアップロードします。
genbankはNCBIなどのサイトからダウンロードします。

左側のバーのフォルダボタンをクリックしフォルダを開きます。

次にアップロードボタンをクリックし必要なgbファイルをアップロードします。

次に新しいコードセルを追加し、

!clinker *.gb -p result.html

と入力し実行します。
ファイルの拡張子がgbkの場合はgbをgbkに置き換えます。
解析が終了するとresult.htmlというファイルが保存されますのでダウンロードしてください。

他に色々応用が効くと思います。

オプションの例

matrixの出力

以下のようにオプションを追加することでmatrixを指定出力することができます。
csv形式で類似度を評価した表が出力されます。

!clinker *.gb -p result.html -mo matrix.csv

以下は出力例です(タブ形式でここは記述してますが、実際はcsv形式です。)。

	seq1	seq2	seq3
seq1	0	0.81522588	0.731927411
seq2	0.81522588	0	0
seq3	0.731927411	0	0

ホモログ判定の閾値を設定

-iを使うことで、ホモログのくくりの閾値を設定することができる。
!clinker *.gb -p result.html -i 0.3

デフォルトは0.3である。identityを閾値に用いているようなので、0.2とかに設定するとかなりの遺伝子がホモログとして認定されてしまう。
下げるとしたらせいぜい0.25~0.28程度。
対象遺伝子の性質に合わせて判定すると良い。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?