#A semi-automatic methodology for facial landmark annotation
顔画像の特徴点抽出のための半自動方法論(データベースの紹介)
##概要
強力な顔画像モデルの開発は学習や確認,テストのために膨大なアノテーションされた顔画像のデータが必要になる.特徴点に関してそれぞれの顔画像の手動アノテーションは職人芸が要求され,作業量は通常膨大になる.不確実なアノテーションの原因は疲れである.存在する少数の顔画像データベースはトレニングデータにしては少数のアノテーションを提供する.さらに,それぞれ異なってアノテーションされたデータベースを用いるのは難しい.この問題は複数のデータベースをもちいた実験を実行不可能なものにする.この困難に対抗するために,私たちはアノテーションされている膨大な顔画像データベースのために,半自動のアノテーション方法論を提案する.この論文ははじめにアノテーションされた膨大な顔画像データベースに適したルーツの開発を想定している.私たちはアノテーションを生成する私達のツールために MultiPIE, XM2VTS, AR, and FRGC Ver. 2 databasesを採用した.アノテーションは以下のサイトで公開されているもので作成した.最終的に私たちは生成されたアノテーションの正確さを確かめる実験を行った.
##はじめに
コンピュタービジョンでは顔画像を用いた研究はポピュラーであり,よく研究された分野でもある.顔画像のアライメントはおそらくもっとも重要な役割である.近年は変化するモデルを元にしたアライメント手法が成功している.一般的に変形するモデルはターゲットオブジェクトの形状や輝度を表現する.変形するモデルは内部にテンプレートを幾つか表現しており,新たなオブジェクトをテンプレートへとFittingする.多様な変形モデルはモデルベースの顔画像分析として提案されてきた.最もよく知られているのはASMやAAMやCLMである.
前述の方法はトレーニング時に正確にアノテーションされた顔画像データベースが必要になる.存在するデータベース[5,9,10,7]はたくさんのバリエーションをカバーしてる(異なるオブジェクト,姿勢,照明,オクルージョンなど).だけれども提供されているアノテーションはいくらかの制限が見受けられる.(1)存在する多数のデータベースは全体の画像の比較的小さなサブセットのアノテーションを提供している[5][7].(2)いくらか良くないアノテーションの画像が含まれている[9].(3)それぞれのアノテーションモデルは異なる数の特徴点を含んでいる[5][9][7][10]
拡張し正確なアノテーションの一つの方法は手動の労力によるものである.だけれどもこれはつまらなくまたタスクのパフォーマンスをあげるトレーニングが必要になる.最終的に,人が原因となり生成されたアノテーションは未だに不確実なものになる.よって,半自動のアノテーションシステムが重要になる.