セマンティックセグメンテーションとは
画像を境界線で抽出するやつのこと。
有名なのは以下の3種類。
・FCN
・SegNet
・U-Net
FCN
FCN (Fully Convolutional Network)は、一般的なCNNの全結合層を畳み込み層に置き換えたものです。
畳み込みで得た特徴マップをヒートマップ化して、逆畳み込みしてアップサンプリングして予測している。
引用:https://zero2one.jp/ai-word/fully-convolutional-netwok/
SegNet
SegNetは、Encoder-Decoder型のFCNで、Encoderでプーリングを行うときにその位置を記録し、Decoderでアップサンプリングするときにその位置に戻すことで、情報の一貫性を保持します。これにより、メモリ効率を上げることができます。
引用:https://arxiv.org/pdf/1511.00561.pdf
U-Net
生物医学のために開発された、セマンティックセグメンテーション用のモデル。
ネットワークがU字型なので、U-Netっていうらしい。
エンコーダとデコーダから成り立ってるモデルで、真ん中から左がエンコーダ、真ん中より右がデコーダ。下図の通り、がっつりスキップ接続を使ってるのが特徴。
引用:https://arxiv.org/pdf/1505.04597.pdf
参考文献