Help us understand the problem. What is going on with this article?

GEOの発現データを使いこなす

More than 3 years have passed since last update.
この記事は、http://d.hatena.ne.jp/fukuit/20151031/1446295539 からの転載です。

GEOのデータを使って、特定の条件での特定遺伝子の発現量を求める方法を何人かに聞かれたので、需要があるのかな?と思って、書いておく。

DataSetsを使いこなす

DataSetsとは、NCBIによってcurationされたGEOデータのことだそうだ。
http://www.ncbi.nlm.nih.gov/geo/ を開いたら、まずはDataSetsのところをクリックする。
20151031213030.png

すると、登録されているDataSetsの一覧画面になる。ここで、自分の欲しい条件で検索する。

とりあえず、Triple Negative Breast Cancerで検索してみたら、2件ヒットした。

このうちのGDS4069の方を見ることにして、Data Analysis Toolsというところをクリックする。
20151031213459.png

ここで遺伝子の発現量を検索できるので、試しにESR1を検索してみる。

20151031213827.png

2件ヒットしたようだ。

1件目の方の、チャートの絵のところをクリックする。
20151031214058.png

すると、triple negativeではほとんど発現していないが、non-triple negativeの一部では高発現でした、ということが分かった。

20151031214059.png

実に簡単だ。簡単すぎる。もし、自分が考えている実験条件に近いものがDataSetsとして登録されていたら、実験をする必要はないかもしれない。事前検討を減らせるかもしれない。

という具合に、研究室で「ちょっとPCに詳しい人」程度のBioInformaticianは失業の危機である。

fukuit
最近、事務系の職場に異動したので、職業プログラマではなくなりました。
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away