NGS解析についてまとめてみよう
TL;DR
バイオインフォマティクスっぽいことも書こうかなと。
次世代シーケンサーの解析って言ってもピンとこない人が多いような気がするので、知識の整理も兼ねてその辺から軽く書いていこうと思います。生物わかんない人にわかるように頑張ろうと思います...(多分無理説ありますが)これQiitaで書く内容なんですかね?ブログ作るのめんどくさいからいいか...
全ての基本、PCR法
PCR法は、極微量しかとれないDNAをin vitroで爆発的に増やす手法です。数がないと話にならないので、分子生物学という分野ではたぶん最頻出の手法だと思います。
この手法は
- DNAを熱することで一本鎖にする。
- DNAポリメラーゼ(新しいDNAを伸長させる酵素)をプライマー(DNAの一部にくっつく配列)結合部位にリクルートしてきます。
- DNAポリメラーゼによってDNAを伸長させます。
- 1~3を繰り返すことで$$2^n$$個の同一のDNAを得ます。
ということで$$O(2^n)$$のオーダーでDNAを増やすことできます。すごい!
そもそも次世代シーケンサーとは?
もともとDNAの配列決定にはサンガー法という方法がとられてきました。サンガー法は以下の画像のように、DNAをPCR法によって増幅する際に取り込むとDNAの伸長反応が停止するジデオキシヌクレオチドを同時に取り込ませることでランダムにDNAの伸長反応を停止させ、長さの違うDNAを合成します。電気泳動などの手法によってDNAの長さごとに分離し、その長さによってDNA配列を決定する手法です。下の図の場合はACGACGTTCGTCA
という配列が決定されます。現在では技術の進歩によって1日くらいあれば500 bp(base pair)程度のリードを200サンプル近く読むことができます(経験談なので最新機器使えばもっといけるかもしれない)。
この方法も十分に画期的であったのですが、近年では次世代シーケンサーと呼ばれる数百万から数十億もの膨大なシーケンシング反応を同時並行して実行できる技術が普及してきました。ここでは、次世代シーケンサーで主に使われているブリッジPCR法とSequencing-by-synthesisという手法に絞って説明しようと思います。ちなみにぼくのIDはilluminaとは関係ないです。
ブリッジPCR
まず、増やしたいDNAの両端にアダプター(プライマーの進化版みたいなやつ)をつけます。このアダプターをフローセル(DNA置く場所)に固定します(①〜②)。このとき太い方の青いアダプターと細い方の青いアダプター同士が結合できるようになっていて、その部分で結合し橋渡し構造(ブリッジ)をとります(③)。アダプターを起点としてPCRを行うことで、DNAを増幅します(④)。この状態で、熱変性させると、アダプター同士の結合が切れることで量が元の倍になります(⑤)。この方法で局所的に(フローセルの一部のみで)DNAを多量合成することができます(⑨)。この手法によって一回の解析で40 Gb~200 Gb程度の配列が得られます。
Sequencing-by-synthesis
さて、材料が揃ったので塩基配列を決定します。ブリッジPCRで増やした部分に3'位(DNAが伸長する方向)をブロックした蛍光dNTPを取り込ませ、一塩基(一配列)だけ伸長させます。取り込ませた蛍光dNTPを光らせてその塩基がなんなのか確認します。確認した後、蛍光物質と3'位をブロックした物質を取り除きます。このサイクルを繰り返すことで配列全てを決定することができます。
実際にNGS解析をしてみる
力尽きました。次に書きます。
結論
Qiitaで書くことじゃないしブログを作ろうと思いましたまる