ECCV2016の論文
https://arxiv.org/pdf/1603.07057.pdf

モチベーション


・Face Recognitionにおいて、少ない学習データ枚数でそれなりの精度を出したい
・Googleの提案モデルが200M枚,Facebookが4.4M枚の顔画像で学習させているが,この論文では495K枚程度のデータセット(CASIA WebFace)で、同じくらいの精度を出したい

スクリーンショット 2017-03-13 21.22.04.png
(a) Face set statistics

手法

・一枚の顔写真から、顔の多様なPose,Shape,Expressionをシミュレートできるようなモデルをつかって、データ数を増やした(詳しくは載ってなかった)

・Pose
顔の角度を{0◦, ±40◦, ±75◦}の範囲でシミュレート
スクリーンショット 2017-03-13 21.36.22.png

・Shape
色んな顔の形(?)を既存の3Dモデルでシミュレート
スクリーンショット 2017-03-13 21.38.32.png

・Expression
口を閉じたり、開けたり、笑顔にしたりをシミュレート
スクリーンショット 2017-03-13 21.39.52.png

結果

・学習データ枚数が495Kから2.4Mになって、LFWにおけるAccuracyも95.31%から98.06%くらいになった (Googleの99.63%には勝てなかった)
スクリーンショット 2017-03-13 21.53.56.png

感想

・Google、Facebookのデータ数で同じことするとどうなるんだろう