2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

バイオインフォマティクスAdvent Calendar 2021

Day 6

Mutation Surveyorを使わずに無料でヘテロ接合Indelを解析したい

Last updated at Posted at 2021-01-18

#サマリー
オープンソースのPoly Peak Parserを使い、サンガー法の出力ファイル(.ab1または.scf)とリファレンス配列から、ヘテロ接合Indel(挿入・欠失)やヘテロ接合SNVを確認します。CRISPRやTALENでも活躍します。

オンラインにファイルを流せる場合はこちらで利用可能です。使用感が確認できます。

#Mutation Surveyorとは
サンガー法の結果解析として用いられている変異解析ソフトウェアです。独自のアルゴリズムにより、高精度でヘテロ接合Indelやヘテロ接合SNVを検出できます。ただし、破茶滅茶にお高い(数十〜数百万円)です。

#Poly Peak Parserとは
その名の通り、クロマトグラムに複数のピークが重複して存在するサンガー法の結果を解析できるRパッケージです。2014年にユタ大学のJonathon T. Hillらによって発表されました*。Mutation Surveyorが手元にない...ヘテロ接合のIndelを確認するのが面倒...そんなときに役立ちます。

*Hill, Jonathon T., et al. "Poly peak parser: Method and software for identification of unknown indels using sanger sequencing of polymerase chain reaction products." Developmental Dynamics 243.12 (2014): 1632-1636.

#環境
Version 4.0 以降のR環境があれば使えます。プラットフォームはWindowsでも、Macでも、Linuxでも大丈夫です。

$ R --version
  R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out"
  Copyright (C) 2020 The R Foundation for Statistical Computing
  Platform: x86_64-apple-darwin17.0 (64-bit)

#導入
びっくりするほど簡単。公式のインストール方法に沿っていくだけです。Rのコンソールを開いて以下のコマンドを打っていきます。確認画面が出てきたら問題がないことを確認し、AllYesを選択します。

BioManagerのインストール
> if (!requireNamespace("BiocManager", quietly = TRUE))
      install.packages("BiocManager")

> BiocManager::install("sangerseqR")
> browseVignettes("sangerseqR")

これで完了です。

#使ってみる
まずはライブラリーを読み込み、PolyPeakParserを起動します。

> library(sangerseqR)
> PolyPeakParser()

ゴニョゴニョといろいろなものが読み込まれていきます。しばらくすると自動でブラウザが立ち上がり、以下のような画面が出てきます。
polypeakparser_1.png
左上のボタンBrowseから解析対象のファイルを選択すると、自動的に処理が始まります。処理が終わると自動的にクロマトグラム表示になります。今回はこちらで公開されている無料のab1ファイルA_forward.ab1を例に解説します。
polypeakparser_2.png
画面左部のペインでかんたんな表示設定や解析設定ができます。
Approx. number of bases per row : クロマトグラム1行あたりの塩基数
5' Trim : 5末端のトリミング長
3' Trim : 3末端のトリミング長
Show Trimmed Region : トリミングされた配列を赤斜線で潰すかどうか
Signal Ratio Cutoff : いちばん大きい波形に対してどれほどの比率の大きさの2nd Peakを拾ってくるか

また、Enter Reference SequenceEnsemblなどで拾ってきたリファレンス配列を入れてあげれば、2nd Peak(2番めに高い波形)との比較ができます。2nd Peakがない場合、1st Peakが採用されます。
polypeakparser_3a.png
リファレンス配列と合致する場所には|が表示されます。今回の例では1箇所だけヘテロ接合と思われる変異が発見されました。

こんな感じで、もう少し長く連続したヘテロ接合のIndelがあるサンプルのab1ファイルを見てみると、これまでは手作業で行っていたであろう「野生型でない方の配列をリファレンス配列と比べてIndel長を検討する」という作業が数秒で行えるようになります。(そういったファイルは持っているのですが、大人の事情でここではお示しできません...すみません)

#まとめ
有料ソフトほどではないですが、ヘテロ接合mutationの検出にかかる時間を短縮することに成功しました。他にも機能があるライブラリーなので、詳しくはBioconductorのページからReference Manualをご覧ください。

2
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?