Kaggle - Carvana Image Masking Challenge1の11位解法2の調査記事です.
Title: LB 11th(0.9971) solution overview
Name: JandJ
Kaggle Discussion: https://www.kaggle.com/c/carvana-image-masking-challenge/discussion/40126
概要
- 二段階に処理を分離
- Stage 1: 1/4縮小画像でマスク領域の予測.
- Stage 2: エッジ部分に絞ってマスク領域の予測
Stage 1
- 320x480にリサイズ
- U-Netで学習
- テストデータのマスクを予測
Stage 2
- ステージ1のマスク領域のエッジ部分を切り取って256x256のパッチ画像を抽出
- 6層のdownsample & upsampleのU-Netを利用
- 訓練時には各パッチ画像は2回ずつ重なるようにデータを作成
- 推論時には各パッチ画像が少なくとも3回は重なるようデータを作成.(U-Netはエッジ領域の判定が苦手だったが,この方法で緩和できた)
- Data Augmentation
- 10%の拡大縮小
- 左右反転
- 輝度, コントラスト
- ずらし
- 損失関数: dice coeff
- Batch Normalizationを利用.(batch内の各種パッチ画像はランダム)
教訓
- 可視化と分析は大事!(Stage 1.でのミスをずっと気づかずじまいだったとのこと)
References
-
Kaggle, Carvana Image Masking Challenge, 2017. ↩
-
JandJ, LB 11th(0.9971) solution overview, 2017. ↩