自分でロングリードシーケンスをしたくなったのでMinIONを買うことにした
購入の手配は全部代理店に任せる感じでした。MinION Starter Pack-Enhancedがだいたい70万弱でだいぶ高いなと思っていたがNEBのキットも別途購入しないといけないらしく結局いいお値段になってしまった。予定ラン回数を考えると普通に外注でもよかったんじゃないか疑惑が。。。
MinIONのアカウント設定が若干めんどくさい。事前にソフト類が動くかチェックしたかったが購入前だとインストールすらできないので注意。
実際の解析の順番とは前後するが、とりあえず手持ちのfast5をfastqに変換できるか確認。
Guppyのインストール
Linux GPU版のをダウンロード。そのままDDBJのサーバーにscpであげる。
たぶんもっとスマートなやり方あり。
あとは普通に解凍したらインストールは完了のようだ。
tar -xf ont-guppy_3.6.0_linux64.tar.gz
2020.5.10.時点で最新のGuppy 3.6.0をインストールした。
fast5をfastqに変換
GPUを使用するためにはログインするときに -l gpu
オプションをつける必要がある。
qlogin -l gpu
base call
よく分からないが以下のコマンドを投げると動いた
# !/bin/sh
# $ -S /bin/sh
# $ -cwd
# $ -l gpu -l cuda=2
# $ -l s_vmem=64G -l mem_req=16G -pe def_slot 4
# $ -l d_rt=192:00:00 -l s_rt=192:00:00
module load cuda10.0/toolkit/10.0.130
/path/to/guppy_basecaller \
--input_path /path/to/fast5_reads \
--save_path /path/to/fastq_reads \
--device cuda:0,1:4G \
--num_callers 4 \
--flowcell FLO-PRO002 \
--kit SQK-LSK109
#$ -l gpu -l cuda=2
使用するcudaの数(?)を指定
#$ -l s_vmem=64G -l mem_req=16G -pe def_slot 4
これを指定しないとすぐ止まってしまった。--num_callers
が4だったから???よく分からん。
module load cuda10.0/toolkit/10.0.130
でcudaを使えるようにしておく。的な。
あとはガイド通りにinputとoutputのpathを指定する。フローセルのIDとキットも指定された通りに記載。
--device cuda:0,1:4G
ここもガイドどおりに。2個GPUを使用することにした。なぜか4Gにしたが
https://sc.ddbj.nig.ac.jp/ja/guide/hardware
6Gまでいけるということかしら??
終わったら続きを書きます。
201220 Guppy 4.2.2でベースコール
Guppy のバージョンが上がったのでそちらでもやってみる。
よくわからないけど--device cuda:0,1:4G
の設定では動かず、--device cuda:0:4G
にすると動いた。
15Gbくらいが一晩くらいで出力された。
CUDAはdefaultで最新版が使用できる設定になっているので、上でやっているようなmodule loadは必要なかった。
# !/bin/sh
# $ -S /bin/sh
# $ -cwd
# $ -l gpu -l cuda=2
# $ -l s_vmem=64G -l mem_req=16G -pe def_slot 4
# $ -l d_rt=192:00:00 -l s_rt=192:00:00
/oath/to/guppy_basecaller \
--input_path /path/to/fast5_dir \
--save_path /path/to/fastq_dir \
--device cuda:0:4G \
--num_callers 4 \
--flowcell FLO-MIN106 \
--kit SQK-LSK109
たしかにGuppy3より全体的にQualityが向上している