はじめに
肺がんは早期発見が非常に重要であり、AI技術、特に深層学習を用いた病変検出は大きな期待が寄せられています。最近人気の物体検出モデル「YOLOv5s」をCT画像から肺がん病変検出に使えるか、詳しく検討してみます。
① YOLOv5sとはどのようなモデル?
YOLOv5sは本来、「物体検出(Object Detection)」モデルです。
- **画像分類モデル(Image Classification)**では、画像全体を1つのカテゴリーに分類します。
- **特徴抽出モデル(Feature Extraction)**は画像内の特徴を数値的に抽出し、その後別のモデルやタスクに活用します。
- 一方でYOLOv5sのような物体検出モデルは、画像内の複数の物体を識別し、それぞれの位置を示すBounding Box(境界ボックス)とカテゴリ情報を同時に推定します。
つまり、肺がん病変をBounding Boxとして検出することは、YOLOv5sの機能に適合します。
YOLOv5sで肺がん検出が難しい理由
技術的には可能ですが、実務上、以下の課題があり簡単とは言えません。
-
CT画像の3次元データ特性
YOLOv5は通常、2次元画像に対して設計されているため、CTのような3D画像をスライス単位に処理する必要があります。そのため、3次元空間での情報が失われる可能性があります。 -
病変サイズの小ささ
肺がんの初期病変は非常に小さく低コントラストであることが多く、軽量モデルであるYOLOv5sでは十分な精度が出にくい可能性があります。 -
データセットのラベリングの困難さ
肺がん病変のラベリングには医師や放射線技師による専門知識が必要で、データ収集やアノテーションに高いコストと精度が求められます。
LIDC-IDRIデータセットで最も精度が高いモデル
肺がん病変検出の評価で広く用いられる「LIDC-IDRI」データセットに対し、高い性能を示したモデルがいくつかあります。その中でも特に注目されているのが、以下の2つのモデルです。
-
ProCAN(Progressive Growing Channel Attentive Non-Local Network)
- 精度:95.28%、AUC:98.05%
- 特徴:段階的に特徴を学習し、注意機構と非局所的特徴抽出(Non-Local)を用いて、微細な肺病変を高精度で分類。
-
DeepLung・nnDetection(3D CNNベースモデル)
- nnDetection(代表例):LIDC-IDRIやLUNA16を使用した肺がん結節の検出に特化。3次元情報を有効活用。
- DeepLung:3D CNNを利用した高精度モデル。LUNA16データセットにおいてAUC約0.97-0.98の性能を実現。
特に3D CNNベースのモデルは、病変検出精度が高く、3次元の空間情報をより適切に扱うことが可能です。
肺がん病変検出用にYOLOv5sをファインチューニングする具体的手順
肺がんの病変検出にYOLOv5sを利用する場合、次の手順で進めます。
-
データ収集とラベリング
- DICOM画像(CT画像)をPNGやJPEG形式に変換し、Bounding Boxでラベリング(LabelImgやCVATなどのツールを使用)。
-
前処理・データ準備
- HU値調整による肺部位抽出。
- YOLOフォーマットでラベルを保存。
-
環境構築
- YOLOv5 GitHubリポジトリのCloneと依存関係のインストール(PyTorch、CUDA)。
-
データセットの構築
- train/val/testセットに画像とラベルを分割。
-
設定ファイル(YAML)の調整
- YOLO用のdataset.yamlファイルでデータセットのパス指定。
-
トレーニング
- 事前学習済み重みを使った学習開始。
-
モデルの評価と推論
- mAP(平均適合率)を使用した精度評価。
- 新規画像への推論。
商用利用可能な既存モデル
商用利用可能な代表的なモデルとしては、以下が挙げられます。
- nnDetection(3D CNN): Apache License 2.0(商用利用可能)
- DeepLung(3D CNN): MIT License(商用利用可能)
ProCANなど、ライセンスが不明瞭なものについては商用利用は慎重に行う必要があります。
結論と推奨
肺がん検出はYOLOv5sでも可能ですが、本来の用途(一般物体検出)とは異なり、高精度を出すには3次元的情報を活用するnnDetectionやDeepLungなどの専門的なモデルがより適しています。
医療現場への導入を視野に入れる場合は、上記の特化モデルの利用が推奨されます。
以上が、肺がん検出へのYOLOv5s適用可否、及び肺CT画像分析における既存モデルの現状と実践的なファインチューニング手順です。
ぜひ参考にしてください。