🧬 ゲノム関連データベースまとめ
1. INSDC三大機関(塩基配列データベース)
地域 |
機関 |
略称 |
主なID |
日本 |
DDBJ |
DDBJ |
DRA, DRR, DRX, DRS |
アメリカ |
NCBI |
GenBank / SRA |
SRA, SRR, SRX, SRS |
ヨーロッパ |
EBI |
ENA |
ERA, ERR, ERX, ERS |
※ INSDC(International Nucleotide Sequence Database Collaboration)により、3機関はデータを相互共有している。
2. 遺伝子発現・エピゲノム・メタゲノム系
データベース |
内容 |
管理機関 |
GEO |
遺伝子発現(RNA-seq, マイクロアレイ) |
NCBI |
ArrayExpress |
GEOのヨーロッパ版 |
EBI |
ENCODE |
エピゲノム、転写因子結合など |
米国NIH |
TCGA |
がんゲノム・トランスクリプトーム |
米国NCI |
MG-RAST |
メタゲノム解析 |
米国Argonne国立研究所 |
GISAID |
ウイルス(インフルエンザ、SARS-CoV-2) |
国際共同運営 |
3. ゲノムアノテーション・参照ゲノム
データベース |
内容 |
備考 |
UCSC Genome Browser |
ゲノムブラウザ |
ヒト・マウスなど多種対応 |
Ensembl |
ゲノムアノテーション |
EBI主導 |
RefSeq |
標準的な遺伝子・タンパク質配列 |
NCBI |
4. タンパク質・機能・パスウェイ系
データベース |
内容 |
UniProt |
タンパク質配列・機能 |
KEGG |
パスウェイ、代謝経路、疾患情報 |
Reactome |
生物学的経路(ヒト中心) |
5. 使い分けの目安
- 配列を探す → DDBJ / NCBI / ENA
- 発現データを探す → GEO / ArrayExpress
- ゲノム構造を見たい → UCSC / Ensembl
- タンパク質や機能を調べたい → UniProt / KEGG