1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Conditional Generative Adversarial Network for Structured Domain Adaptationを読んだ

Last updated at Posted at 2018-10-13

Weixiang Hong, Zhenzhen Wang, Ming Yang, Junsong Yuan
CVPR2018
pdf

どんなもの?

近年,学習データの拡張のための合成データ生成手法が多く提案されている.
しかし,実データと合成データのドメインの不一致という問題が起きる.
これを解決するために,GANをFCNのフレームワークに統合することによって,セマンティックセグメンテーションのためのドメイン適用手法を提案.
image.png

先行研究との差分

  • 合成画像の特徴(source domain)を実画像からの特徴(target domain)のように変換するconditional GANを学習.
  • 合成画像と合成画像のラベル,実画像を使用する.実画像のラベルは不要.
  • 提案手法はstate-of-the-artの手法をmean IoUで12 ~ 20%上回った.

技術や手法のキモ

合成画像(source domain)と実画像(target domain)のドメインギャップを埋めるために,「合成画像をもとに,target domainから得られた特徴マップを生成するようなconditional generatorを学習」する.
discriminatorは実画像の特徴マップ($x^t$) or 合成画像からの特徴マップ($x^f$)なのか判別する.

$D$はdiscriminator branch,$T$はpixel-wise classifier branch.

image.png
※Figure 2を加工

最適化には以下のミニマックスを解く.
$L_t$は画像中の各ピクセルにおけるクロスエントロピー誤差の和.
image.png
image.png
image.png

どうやって有効性を検証したか

target domain(実画像)のデータセットとして

source domain(合成画像)のデータセットとして

を用いて,性能の向上を比較.
提案手法はsource domain, target domainの画像で学習し,target domainの画像でテスト.
比較手法はtarget domainの画像で学習し,target domainの画像でテストのはず.

  • No adaptation (NoAdapt) : source domainの画像で学習しただけ
  • FCNs in the wild (FCN Wld) : FCNの拡張版 [21]
  • Curriculum learning (CL) : セマンティックセグメンテーションのドメインギャップを小さくする手法 [45]
  • Cross city adaptation (CCA) : pre-trainedのnetworkをrefineする手法[9]

image.png

  • ドメイン適用で大幅に(23%)性能向上(NoAdaptと比較) -> ドメイン適用が有効
  • その他のstate-of-the-artとの比較でも12% ~ 20%の性能向上

以下は提案手法で異なるsource domain画像(SYNTHIA, GTA)を用いた場合の結果.

image.png

Table1, 2の比較から,GTAを用いた方が良い結果だった(これはおそらく画像枚数による,24996 vs 9400).
以下は使用する画像枚数の変化が,結果にどれだけ影響するかを検証したもの.
Fig 4(a)から

  • 使用する合成画像の枚数が多いほど性能は向上
  • しかし多すぎてもIoUがサチる(さらに多様なシーンが必要)
    image.png

さらに,"Skip Pooling"を適用した場合とconditional generatorを省いた場合と比較.
image.png

conditional generatorへの入力をConv1~5と変えた結果とresidual blockの数を変えた結果.

  • lower layerがより詳細なlow-levelの特徴を捉えていることが良い結果に繋がっている
  • imageをそのまま入力してもいいが,Conv1の方が入力のサイズが小さい

image.png

入力するノイズの有無で比較.

  • ノイズによりunlimited numberの訓練サンプルを作ることができる

image.png

議論はあるか

  • セマンティックセグメンテーションのためのドメイン適用手法を提案
  • GANベースのアプローチでconditional generatorがsource domain画像の特徴マップをtarget domain画像の特徴マップのように変換する
  • state-of-the-artの手法の性能を,実際の交通シーンのデータセットにおいて上回った

次に読むべき論文

CVPR2018のGANを用いた手法いろいろ

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?