論文紹介-#2
落合先生のフォーマットを元に論文をまとめ紹介していく記事です。
今回は、CVPR2018のWing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networksという論文を紹介します。
至らないところばかりなのでツッコミお待ちしてます!
どんなもの?
CNNベースのfaces alignmentにおいてL2 よりL1, L1 smoothの方が良いことを示した。
wing lossという新しいloss functionを提案と顔のポーズのデータバランス戦略、二段階のalignment frameworkによりface alignmentでSOTA。
先行研究と比べてどこがすごい?
既存研究の多くが外れ値に敏感なL2 loss関数を使っているのに対して、新しいwing lossを提案。
精度はSOTAではないが、6層のCNNを使うことで他の既存DNN face alignmentよりも早い結果に。
入力サイズは恐らく224 * 224 * 3
技術や手法のキモはどこ?
L1もL2も大きなlossに学習が影響されやすい。wong lossは小さなlossと大きなlossの影響のバランスをうまく取った。
どうやって有効だと検証した?
AFLWと300Wデータセットに対して、既存研究と精度比較した。
様々なbaseCNNを用い、展開性を検証した。
少数の訓練サンプルを複製し、ランダムな回転などのデータオーグメントを適用することでデータの不均衡問題に対応した。
議論はある?
CNNベースの他の回帰問題にもwing lossは使えるのではないか?