LoginSignup
0
3

More than 3 years have passed since last update.

【Semantic Segmentation】DeepLab (V1) : Fully Connected CRFでセグメンテーションを向上

Posted at

背景

Semantic SegmentationでDeepLabというのが有名だったから調べてみる事にした。
特徴は
1. Dilated Convolutionを使ってること(画像全体の特徴を取るため)
2. Fully Connected CRFを使っていること(画像全体でrefinementするため)

全体像

image.png

DeepLabでは3stepだけ

  1. CNN(Dilated Conv含む)で畳こむ
  2. Bi-linear Interpolationで画像サイズを拡大する
  3. CRFでRefineする

CRFってなんじゃい?!

一度クラスに分類された結果をよりよく修正する事が出来るのがCRF。

「同じような色や近くにあるpixelは同じクラスに分類されるはずだ!」
という仮定から
近隣pixelとの類似度(事前に自分で定義した関数)を元にして結果をupdateする

いうなればsmoothingですね

image.png

お隣さんとの比較で先端が良くなっている!

詳しくはこちらを
https://news.mynavi.jp/article/cv_future-36/

Fully Connected CRFってなんじゃい?!

従来のCRFは近場だけで比べるからlocalな結果のupdateは出来るんだけど、細い物体とかの精度を上げるのが難しい。(だから飛行機を例に出したのね)

「もっと全体をみなきゃダメだ!」という事でCRFをFully Connectedにしてみたらしい。
計算量ヤバそう笑

image.png

左側はCNNによって推定されたclass probability scoreの逆数=>コスト
右側はpixel iとpixel jが違うクラスと分類された時の色情報と距離情報が近ければ値が大きくなる=>コスト

このコストを最小化する事でsmoothing出来る

結論

CRFを使うとsmoothing出来るんだなってのがわかった。
コストの最小の仕方に関して少し分からなかったので、また調べたいと思う

参考文献

SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS
https://arxiv.org/pdf/1412.7062.pdf

https://news.mynavi.jp/article/cv_future-36/
Conditional Random Fields as Recurrent Neural Networks
https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Zheng_Conditional_Random_Fields_ICCV_2015_paper.pdf

0
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
3