第一回:DICOMって何?
医療AI開発に興味がある皆さん、こんにちは!
医療分野でAIを開発する際、避けて通れないのが「DICOM(Digital Imaging and Communications in Medicine)」という画像フォーマットです。AIモデルに画像データを学習させるためには、このDICOMを正しく理解し、扱う必要があります。しかし、DICOMは独特な構造をしており、初めて触れる方にとっては少し難しく感じるかもしれません。
この記事では、医療AI開発者として知っておくべきDICOMの基礎知識を解説します。第一回となる今回は、まずDICOMの全体像を説明します。
DICOMとは?
DICOMとは、医療機関で使用される医用画像を扱うための世界標準規格です。
病院内にあるCTやMRI、単純X線などの医療機器で撮影された画像は、すべてこのDICOM形式で保存・転送されます。これにより、異なるメーカーの機器間でもスムーズに画像のやり取りが可能になります。
DICOMは、米国の団体が標準化を行っており、その定義は公式ウェブサイトで公開されています。主に以下の2つの側面から成り立っています。
- 医用画像ファイルフォーマット: 画像データとそれに付随する情報を一つのファイルにまとめるための規格
- 医療機器間の通信規格: 病院内で医療画像データをやり取りするための通信プロトコルの規格
今回のブログシリーズでは、AI研究者にとって特に重要となるファイルフォーマットとしてのDICOMに焦点を当てて解説します。DICOM通信については、また別の機会に詳しくご紹介します。
DICOMファイルフォーマットの基本構造
DICOMファイルは、単に画像データだけを格納しているわけではなく、大きく以下の2つのパートから成り立っています。
- メタ情報(Metadata): ファイルのヘッダ部分に格納される画像データに付随する情報
- 画像データ(Pixel Data): 実際に撮影されたCTやMR画像データそのもの
メタ情報には患者情報(ID、氏名、生年月日など)や撮影情報(撮影日、医療機器、撮影条件など)の他に、DICOM画像を正しく画像ファイルへ変換するために不可欠な情報も含まれています。
DICOMから画像を取り出した際に、画像が真っ黒になったり、真っ白に飛んでしまったりしたという話を聞いたことがあるかもしれません。これは、メタ情報に含まれるビット深度やウィンドウ幅(WW)/ウィンドウ中心(WC)を利用せずに画像を変換していることで発生しています。
このように、メタ情報にはAI開発における上で重要な情報が含まれています。
DICOMの鍵となる概念:タグと値
DICOMファイルに含まれるすべての情報、つまりメタ情報も画像データも、タグ(Tag) と 値(Value) のペアで構成されます。
タグは、情報が何を意味するかを定義する8桁の16進数で、(グループ番号, 要素番号) の形式で表現されます。例えば、(0010, 0010)は「Patient's Name(患者名)」を表すタグとして定義されています。
| タグ | タグ名称 | 値 |
|---|---|---|
| (0008, 0020) | Study Date | 20250909 |
| (0008, 103E) | Series Description | BRAIN T1 MPRAGESAG |
| (0010, 0010) | Patient's Name | Trenser Hanako |
| (7FE0, 0010) | Pixel Data | [画像データのバイナリデータ] |
このように、DICOMのファイルは、メタ情報と画像データの両方が、タグと値のペアという一貫した構造によって管理されているため、情報の一貫性と正確性が保たれています。
次回予告
今回は、DICOMファイルがメタ情報とピクセルデータで構成されていること、そしてこれらがタグという形式で管理されていることについて解説しました。DICOMファイルは単なる画像の入れ物ではなく、画像と関連情報が一体となった情報の塊であることを理解することが、AI開発において重要です。
第二回では、今回触れたDICOMタグについてさらに深堀します。特に、DICOM規格のPart3を紐解きながら、AI開発で利用されそうな重要なタグをいくつかピックアップし、その見方や役割について具体的に解説していきます。