🧬 ゲノム関連データベースまとめ
1. INSDC三大機関(塩基配列データベース)
| 地域 | 機関 | 略称 | 主なID |
|---|---|---|---|
| 日本 | DDBJ | DDBJ | DRA, DRR, DRX, DRS |
| アメリカ | NCBI | GenBank / SRA | SRA, SRR, SRX, SRS |
| ヨーロッパ | EBI | ENA | ERA, ERR, ERX, ERS |
※ INSDC(International Nucleotide Sequence Database Collaboration)により、3機関はデータを相互共有している。
2. 遺伝子発現・エピゲノム・メタゲノム系
| データベース | 内容 | 管理機関 |
|---|---|---|
| GEO | 遺伝子発現(RNA-seq, マイクロアレイ) | NCBI |
| ArrayExpress | GEOのヨーロッパ版 | EBI |
| ENCODE | エピゲノム、転写因子結合など | 米国NIH |
| TCGA | がんゲノム・トランスクリプトーム | 米国NCI |
| MG-RAST | メタゲノム解析 | 米国Argonne国立研究所 |
| GISAID | ウイルス(インフルエンザ、SARS-CoV-2) | 国際共同運営 |
3. ゲノムアノテーション・参照ゲノム
| データベース | 内容 | 備考 |
|---|---|---|
| UCSC Genome Browser | ゲノムブラウザ | ヒト・マウスなど多種対応 |
| Ensembl | ゲノムアノテーション | EBI主導 |
| RefSeq | 標準的な遺伝子・タンパク質配列 | NCBI |
4. タンパク質・機能・パスウェイ系
| データベース | 内容 |
|---|---|
| UniProt | タンパク質配列・機能 |
| KEGG | パスウェイ、代謝経路、疾患情報 |
| Reactome | 生物学的経路(ヒト中心) |
5. 使い分けの目安
- 配列を探す → DDBJ / NCBI / ENA
- 発現データを探す → GEO / ArrayExpress
- ゲノム構造を見たい → UCSC / Ensembl
- タンパク質や機能を調べたい → UniProt / KEGG