Clinkerは遺伝子クラスターの比較図を簡単に出力してくれるバイオインフォマティクス用のツールです。
非常に見やすく、遺伝子比較図を出力することができるので有用なツールです。
一方で、PCが苦手な人には扱いにくいかもしれません。
google colaboratry 利用して比較的簡単に動作させることができるので、初心者も利用してみるといいと思います。
Google colaboratoryを開きコードセルを追加します。
最初のセルに
!pip install clinker
と入力し実行します。
するとclinkerのインストールが始まります。
2022年11月21日現在、biopythonをv18.0にアップデートすると動作しないようです。
以下の操作でダウングレードします。
!pip install biopython==1.79
次に比較に使いたいgenbankファイルをアップロードします。
genbankはNCBIなどのサイトからダウンロードします。
左側のバーのフォルダボタンをクリックしフォルダを開きます。
次にアップロードボタンをクリックし必要なgbファイルをアップロードします。
次に新しいコードセルを追加し、
!clinker *.gb -p result.html
と入力し実行します。
ファイルの拡張子がgbkの場合はgbをgbkに置き換えます。
解析が終了するとresult.htmlというファイルが保存されますのでダウンロードしてください。
他に色々応用が効くと思います。
オプションの例
matrixの出力
以下のようにオプションを追加することでmatrixを指定出力することができます。
csv形式で類似度を評価した表が出力されます。
!clinker *.gb -p result.html -mo matrix.csv
以下は出力例です(タブ形式でここは記述してますが、実際はcsv形式です。)。
seq1 seq2 seq3
seq1 0 0.81522588 0.731927411
seq2 0.81522588 0 0
seq3 0.731927411 0 0
ホモログ判定の閾値を設定
-iを使うことで、ホモログのくくりの閾値を設定することができる。!clinker *.gb -p result.html -i 0.3
デフォルトは0.3である。identityを閾値に用いているようなので、0.2とかに設定するとかなりの遺伝子がホモログとして認定されてしまう。
下げるとしたらせいぜい0.25~0.28程度。
対象遺伝子の性質に合わせて判定すると良い。