30
32

More than 3 years have passed since last update.

画像解析のためのバイオイメージデータベース

Posted at

バイオイメージ

バイオイメージとは、さまざまな組織・細胞・分子レベルの生命現象を撮像した画像を指す。近年では、高度なイメージング技術によって様々なモダリティのバイオイメージが撮像できるようになり、可視化できる生命現象の対象が広くなった一方で、それらを撮像したバイオイメージの管理を行うデータベースは数多く存在しており、未だに完全な標準化・統一化はなされていない。
ここでは、そのようなデータベースの中でも、画像解析を用いた生物学的なアプリケーションを開発するためのデータ (いわゆる、正解データ, Ground Truth) もセットで用意されたデータベース/データセットに焦点を当ててリストアップする。

なおこのリストには、バイオイメージのみ管理しているデータベースや、医用画像 (CT, MRI, X-ray, PETなど) データセットのみ扱っているデータベースは含めない。また、このリストを作成するにあたり、以下の論文を参考にした。随時更新予定。

データベースリスト

2020/05/17 現在

Database/Dataset Modality Dimension Ground Truth Description
Broad Bioimage Benchmark Collection Bright, DIC, Fluo, Hist 2D, 3D C D S O 45 datasets
Cell Tracking Challenge Bright, DIC, Fluo 2D, 3D, Time D S T 19 datasets
Cell Image Library Bright, PhD, DIC, Fluo, Electron 2D, 3D, Time C S 10,000+ datasets
Image Data Resource Bright, PhD, DIC, Fluo, Electron, Hist 2D, 3D, Time C S several datasets
UCSB Bio-Segmentation Benchmark Bright, DIC, Fluo, Hist 2D, 3D, Time C D S T 7 datasets
Grand Challenge in Biomedical Image Analysis Bright, PhD, DIC, Fluo, Hist 2D, 3D C D S T several challenges
Electron Microscopy Data Bank Electron 2D, 3D S several datasets
TEM Dataset Electron 2D S 6 datasets

Kind of Ground Truth
C: Classification
D: Detection
S: Segmentation
T: Tracking
O: Others

Broad Bioimage Benchmark Collection (BBBC)

細胞画像解析ソフトウェアとして有名な CellProfiler の開発元でもある Broad Institute's Imaging Platform が管理しているデータベース。
豊富な種類のGround Truthが含まれた45種類のデータセットが管理されている。

ref: Annotated high-throughput microscopy image sets for validation

Cell Tracking Challenge

ISBI の細胞セグメンテーション/トラッキングのコンペティションで用いられたデータセットも含めた、すべて時系列のデータセットが管理されている。
データセットごとの細胞系列数は少なく、セグメンテーションのGround Truthは不完全な場合が多いが、時系列数は十分なため主にトラッキングアルゴリズム開発用に用いられる。

ref: An objective comparison of cell-tracking algorithms

Cell Image Library

CRBS が管理しているさまざまな細胞画像のデータベース。
データの種類は豊富で約10,000以上のデータセットが存在するが、一部のデータセットにのみ Ground Truth が付与されているため、目的のデータセットを探すのがわりと大変。

Image Data Resource

OME ConsortiumEMBL-EBI が共同で管理している、最大規模のバイオイメージデータベース。
さまざまなデータセットが管理されているが、UIが非常に不親切で目的のデータセットが見つからない場合が多いため個人的にはあまり使いたくない。ただ、生物系論文に用いられたデータの多くがこのデータベースに集約されているため、論文ベースの検索を行うならこのデータベースがよい。

ref: Image Data Resource: a bioimage data integration and publication platform

UCSB Bio-Segmentation Benchmark

Center for Bio-Image Informatics が管理しているデータベース。
さまざまなスケール (分子・細胞・組織) のデータセットが管理されており、Ground Truthも部分的に作成されている。

Grand Challenge in Biomedical Image Analysis

Ground Challenge という医用画像解析アルゴリズムのコンペティションを行うための課題が集められたデータベース。
医用画像が主に多いが、バイオイメージも多く含まれている。以下にバイオイメージに焦点を当てた課題を列挙する。

Electron Microscopy Data Bank

EMBL-EBI が管理している電子顕微鏡画像データベース。
Stanford/SLAC CryoEM FacilityResearch Collaboratory for Structural Bioinformatics (RCSB) などとも連携して管理を行なっている。

ref: Trends in the Electron Microscopy Data Bank (EMDB)

TEM Dataset

University of Freiburg の Computer Vision Group が管理しているデータベースにある、電子顕微鏡画像のセグメンテーションタスク用データセット。
他にも Computer Vision 用のデータセットが多数用意されている。

30
32
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
30
32