論文紹介-#3
落合先生のフォーマットを元に論文をまとめ紹介していく記事です。
今回は、Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networksという論文を紹介します。
至らないところばかりなのでツッコミお待ちしてます!
どんなもの?
MTCNN並みのリアルタイム性を保持しつつ回転不変の顔枠検出を行うProgressive Calibration Network(PCN)を提案した。
先行研究と比べてどこがすごい?
一般的に、回転に対して以下3つの戦略が取られる
1, データオーグメンテーション
一般的な顔枠検出器に回転顔データを入れるというもの。モデルに修正なく学習出来るが、学習にコストがかかってしまう。
2, 分割統治法
各回転角度に対して、それぞれのモデルを学習するというもの。一つのモデルは小さくて済むが、全体的に時間がかかってしまう。
3, Rotation router
ルーターネットワークにより推定したRIP角度を元に直立するようにキャリブレーションした顔画像に対して、顔枠検出を行うというもの。RIP角度の推定は難易度が高い為大規模なモデルになってしまう、かつルーターネットワークの誤検出が顔枠検出にも影響してしまう。
これらの既存の方法は、大きなRIP変動を処理するために速度と精度とはトレードオフの関係だったが、段階的なキャリブレーションプロセスを導入することで、正確で迅速な顔枠検出を可能にした。
技術や手法のキモはどこ?
PCNは、180度、90度、45度(最後は-45~45の間で直接RIP角度推定)とキャリブレーションプロセスを3段階に分け徐々に顔を直立にしていくことで、予測タスクが簡単になり正確で迅速なキャリブレーションを実現できる。
どうやって有効だと検証した?
データオーグメンテーション、分割統治法、rotarion routerの3つの従来戦略を最先端の顔枠検出モデルに適用しFDDBデータセットとWIDER FACEデータセットで比較した。
議論はある?
言及なし