「Galaxy」のチュートリアル「Introduction to Genomics and Galaxy」の日本語版を作成したときに、
「分かりにくいなあ」
「チュートリアル通りにならないよ!」
となる気がしたので、追加で説明します。
#チュートリアル中の定義について
チュートリアルにある用語の定義をまとめておきます。
- ゲノム:生物に固有なすべてのDNAのまとまり。
-
染色体:生物におけるDNAの最大単位。ヒトは23本の染色体を2対持っています。
-
ストランド:染色体は二本鎖であり、この「鎖」のことを指します。1本はファワード鎖で、もう1本はリバース鎖です。
-
遺伝子:このチュートリアルでは、染色体上にある、生物が使用する分子を作るDNAの部分のことを指します。
-
リファレンスゲノム:徹底的に研究して調べ上げた単一個体のゲノムで、DNAの大部分が正確に解明されているゲノムを指します。参照となるゲノムです。リファレンスゲノムはその生物を研究している研究者によってゲノムマップという形で共有されています。リファレンスゲノムは定期的に更新されます。
-
シークエンス(配列):A C T G(単一ヌクレオチド)のレベルまでそれぞれの存在する正確な位置を含むゲノム中のDNAを指します。
-
ゲノム/遺伝子 アノテーション:シークエンス(配列)ではどのようなDNAがどこにあるかが分かりますが、それらのDNAの機能については分かりません。アノテーションは遺伝子やプロモーター、セントロメアといった特定のゲノム領域がどこであるかを示す追加の情報を持っています。
-
ゲノム範囲(genomic interval):このチュートリアルではゲノム範囲は染色体の一部にまたがるものを指します。例えば遺伝子や染色体もゲノム範囲になります。
- エキソン:分子を作ることができるDNAの部分を指します。
#このチュートリアルは何をやっているのか
まずは染色体二本鎖上に存在する遺伝子の何%が二本鎖で重なっているのかを調べ、その後にエキソン部分のみのデータでエキソンの何%が二本鎖で重なっているのかを解析で導いています。
上図にある、赤色の斜線領域のように重なっているエキソンが、どのくらいの割合で存在しているのかを最終的に調べています。
本チュートリアルの大まかな流れとしては、
データのインポート(UCMC Main ツールを使用)
↓
インポートしたデータをフォワード鎖とリバース鎖のデータセットに分割する(Filter ツールを2回使用)
↓
染色体二本鎖間での遺伝子の重なりをチェックする(Intersect ツールを2回使用)
↓
フォワード鎖とリバース鎖の重なっていた遺伝子のデータセットを1つにまとめる(Concatenate datasets ツールを使用)
↓
ゲノムブラウザーでデータを表示する
↓
ワークフローを作成する
↓
新しいヒストリーを作成してデータを現在のヒストリーから移動する
↓
エキソンのデータを取得する
↓
作成したワークフローを実行
という風になっています。
最終的に下図のような28のエキソンのデータが表示されたらチュートリアル完了です。
#Intersect ツールをなぜ2回実行するのか
重複部分をチェックする際に Intersect ツールを2回使うのは、重複した部分が下図のように結果として出てきます。(Galaxy のツールをクリックしても似たような図が出てきます)
上図のように、このツールの今回の設定では、2つ目のデータセットに重複している1つ目のデータセットを抽出しています。
なので、1回目の Intersect ツールではリバース鎖の遺伝子と重なっているフォワード鎖の遺伝子を抽出し、2回目の Intersect ツールではフォワード鎖の遺伝子と重なっているリバース鎖の遺伝子を抽出しています。
以上で Introduction to Genomics and Galaxy の補足説明を終わりにします。
ほかに分からないことがあればコメントか、Galaxy のセミナーに参加して私にお尋ねください。
リンクなど
- Introduction to Genomics and Galaxy の原文
(http://galaxyproject.github.io/training-material/topics/introduction/tutorials/galaxy-intro-strands/tutorial.html ) - Introduction to Genomics and Galaxy 日本語版
(https://github.com/A-Asai/training-material/blob/master/topics/introduction/tutorials/galaxy-intro-strands/tutorial_ja_notag.md ) - Galaxy
(https://usegalaxy.org/ ) - Galaxy Seminar
(https://pitagora.connpass.com/ )