バイオイメージ
バイオイメージとは、さまざまな組織・細胞・分子レベルの生命現象を撮像した画像を指す。近年では、高度なイメージング技術によって様々なモダリティのバイオイメージが撮像できるようになり、可視化できる生命現象の対象が広くなった一方で、それらを撮像したバイオイメージの管理を行うデータベースは数多く存在しており、未だに完全な標準化・統一化はなされていない。
ここでは、そのようなデータベースの中でも、画像解析を用いた生物学的なアプリケーションを開発するためのデータ (いわゆる、正解データ, Ground Truth) もセットで用意されたデータベース/データセットに焦点を当ててリストアップする。
なおこのリストには、バイオイメージのみ管理しているデータベースや、医用画像 (CT, MRI, X-ray, PETなど) データセットのみ扱っているデータベースは含めない。また、このリストを作成するにあたり、以下の論文を参考にした。随時更新予定。
データベースリスト
2020/05/17 現在
Database/Dataset | Modality | Dimension | Ground Truth | Description |
---|---|---|---|---|
Broad Bioimage Benchmark Collection | Bright, DIC, Fluo, Hist | 2D, 3D | C D S O | 45 datasets |
Cell Tracking Challenge | Bright, DIC, Fluo | 2D, 3D, Time | D S T | 19 datasets |
Cell Image Library | Bright, PhD, DIC, Fluo, Electron | 2D, 3D, Time | C S | 10,000+ datasets |
Image Data Resource | Bright, PhD, DIC, Fluo, Electron, Hist | 2D, 3D, Time | C S | several datasets |
UCSB Bio-Segmentation Benchmark | Bright, DIC, Fluo, Hist | 2D, 3D, Time | C D S T | 7 datasets |
Grand Challenge in Biomedical Image Analysis | Bright, PhD, DIC, Fluo, Hist | 2D, 3D | C D S T | several challenges |
Electron Microscopy Data Bank | Electron | 2D, 3D | S | several datasets |
TEM Dataset | Electron | 2D | S | 6 datasets |
Kind of Ground Truth
C: Classification
D: Detection
S: Segmentation
T: Tracking
O: Others
Broad Bioimage Benchmark Collection (BBBC)
細胞画像解析ソフトウェアとして有名な CellProfiler の開発元でもある Broad Institute's Imaging Platform が管理しているデータベース。
豊富な種類のGround Truthが含まれた45種類のデータセットが管理されている。
ref: Annotated high-throughput microscopy image sets for validation
Cell Tracking Challenge
ISBI の細胞セグメンテーション/トラッキングのコンペティションで用いられたデータセットも含めた、すべて時系列のデータセットが管理されている。
データセットごとの細胞系列数は少なく、セグメンテーションのGround Truthは不完全な場合が多いが、時系列数は十分なため主にトラッキングアルゴリズム開発用に用いられる。
ref: An objective comparison of cell-tracking algorithms
Cell Image Library
CRBS が管理しているさまざまな細胞画像のデータベース。
データの種類は豊富で約10,000以上のデータセットが存在するが、一部のデータセットにのみ Ground Truth が付与されているため、目的のデータセットを探すのがわりと大変。
Image Data Resource
OME Consortium と EMBL-EBI が共同で管理している、最大規模のバイオイメージデータベース。
さまざまなデータセットが管理されているが、UIが非常に不親切で目的のデータセットが見つからない場合が多いため個人的にはあまり使いたくない。ただ、生物系論文に用いられたデータの多くがこのデータベースに集約されているため、論文ベースの検索を行うならこのデータベースがよい。
ref: Image Data Resource: a bioimage data integration and publication platform
UCSB Bio-Segmentation Benchmark
Center for Bio-Image Informatics が管理しているデータベース。
さまざまなスケール (分子・細胞・組織) のデータセットが管理されており、Ground Truthも部分的に作成されている。
Grand Challenge in Biomedical Image Analysis
Ground Challenge という医用画像解析アルゴリズムのコンペティションを行うための課題が集められたデータベース。
医用画像が主に多いが、バイオイメージも多く含まれている。以下にバイオイメージに焦点を当てた課題を列挙する。
- MoNuSAC
- PatchCamelyon benchmark
- SPIE-AAPM-NCI BreastPathQ
- DRIVE: Digital Retinal Images for Vessel Extraction
- MoNuSeg
- BACH: BreAst Cancer Histology
- Tissue Microarray Analysis
- Gland Segmentation Challenge Contest
- Overlapping Cervical Cytology Image Segmentation Challenge
- SNEMI3D: 3D Segmentation of neurites in EM images
- Segmentation of neuronal structures in EM images
- PathVQA
Electron Microscopy Data Bank
EMBL-EBI が管理している電子顕微鏡画像データベース。
Stanford/SLAC CryoEM Facility や Research Collaboratory for Structural Bioinformatics (RCSB) などとも連携して管理を行なっている。
ref: Trends in the Electron Microscopy Data Bank (EMDB)
TEM Dataset
University of Freiburg の Computer Vision Group が管理しているデータベースにある、電子顕微鏡画像のセグメンテーションタスク用データセット。
他にも Computer Vision 用のデータセットが多数用意されている。