Help us understand the problem. What is going on with this article?

ONTシーケンスのデータで de novo assemblyがしたい

訳あってde novo assemblyをすることになった。
ロングリード、ショートリード、 Hi-Cの三点盛りでアセンブルするぞ!

おおまかな流れ
1. DNA抽出->シーケンス
2. flyeでアセンブル <-今回はここまで
3. racon, pilonでポリッシング
4. BUSCOによるアセンブリ評価
5. Hi-Cで染色体スケールのスキャフォールディング
6. アノテーション

材料について

材料:
イネ科の植物の若めの葉っぱ

ゲノムサイズ:
400Mbくらい

DNA抽出:
ロングリード用:
伝統的なCTAB法 (DNAをくるくるっとまきとるやつ)で抽出後、断片化DNAをShort Read Eliminator (日本ジェネティクス SS-100-101-01)を用いて除去
CTABの方がNucleoBond HMWより長いのが取れている気がする。粘り気が全然違う。...気がする。
イルミナシーケンス用:
DNeasy (Qiagen)

ライブラリ調整&シーケンス:
ONT:
ここから先は外注(いつか自分でもやってみたい)
Illumina:
Kapa Hyperのキット
PCRは3cycle (ほんとはPCRフリーの方が良かったようだ)
だいたい数千万リード 150 PE
Hi-C:
ビオチンがアホみたいに高いのでUeli labのプロトコルを多少モディファイして系を小さくした。
今回はHind IIIで切った。

解析サーバー:
DDBJのスパコン


Step.1 flyeによるde novo assembly

Kolmogorov. et al. nature biotechnology (2019)
https://github.com/fenderglass/Flye

1.1. condaでインストール

conda install -c bioconda flye

1.2. de novo assembly
今回はONTシーケンスはとくに前処理なし。error-correctionや、長いリードだけ取ってくるなどした方がいいらしい。
N50: 20kbくらい
平均長: 10kb弱
だいたいゲノムの100xくらいのカバレッジ

#!/bin/sh
#$ -S /bin/sh
#$ -cwd

##### シェルスクリプトを使用する場合、パスを明示しないとどうもうまくいかない
export PATH=$PATH:~/miniconda3/bin/

#### 仮想環境の立ち上げ
#### 仮想環境を作ってそこにインストールしたので
source activate nanopore

flye --nano-raw hoge.fq.gz \
 --out-dir output \
 --genome-size 400M \
 --threads 16

--out-dir 出力するディレクトリ名の指定
--nano-raw ONTの場合はこのオプションをつける
--genome-size おおよそのゲノムサイズを指定
--threads 使用CPU数

以上のスクリプトを下のようなオプションつけて投げた

qsub -l s_vmem=128G -l mem_req=8G -pe def_slot 16 hoge.sh

だいたい1日ちょっとでアセンブルが終わった。

アセンブル結果の確認はseqkitが便利
Shen et al. PLOS ONE (2016)
https://bioinf.shenwei.me/seqkit/
以下のコマンドでおおよそのアセンブル結果を得る

seqkit stats -a hoge.fasta

つづく

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした