LoginSignup
6
4

More than 5 years have passed since last update.

Githubに投稿されていたAAMのライブラリを用いた顔画像のFitting

Last updated at Posted at 2015-11-09

今回はGithubでAAMのライブラリを発見したためFittingまでを行ってみました.

内容
1. AAMとは
2. AAMのライブラリについて
3. 学習画像の選定
4. AAMの作成とFitting
5. 考察と問題点

1.AAMとは

Active Appearance Models は顔画像のモデル化に用いられる合成モデルである.オブジェクトに付与された形状情報とそれによって形成されるメッシュ内の輝度情報を学習データとしてモデル化を行う.モデル化により得たパラメータ(Appearanceパラメータ)が元の形状,輝度情報を表現できていることから,その顔画像の特徴量として用いられる.また,ある顔画像の輝度情報とAAMをもちいて合成された輝度情報の差を最少にするように勾配法などを用いて最適化を行うことで,その顔画像を表現するアピアランスパラメータを得ることができ,その顔画像を表す特徴量となる.この動作をFittingと呼ぶ.また,その際に合成される形状情報は,その顔画像の特徴点となる.今回はAAMのライブラリを用いてFittingを行う.

2.AAMのライブラリについて

AAMLibrary

 今回Githubで発見した.ライブラリは名前もそのままでAAMLibrary といいます.以下リンクを張っておきます.
 https://github.com/greatyao/aamlibrary

 AAMではモデルの作成とFittingが主な処理になっているのですが,このライブラリはサンプルとしてこの二つの処理の単純な実装を行っています.後はsampleフォルダを参照してください.
 ここでは,以下sampleの実行を行っていきたいと思います.まず初めに行うことはモデルの作成です.そこで,sampleフォルダのrun-build.batを実行します.しかし,ここで問題が発生します.学習画像ファイルがありません.ということで学習画像の選定をまず行わなければいけません.

3.学習画像の選定

 AAMを作成する際には学習データとして,顔画像と特徴点情報が必要になります.この特徴点情報を学習することで未知画像の特徴点を得ることができるのです.そこで学習データとしてもこの二つが必要になります.インターネットで学習データを探すとBioID Face Databaseというデータベースが見つかりましたので今回はこれを使うことにしました.

このデータベースでは,顔画像,目の位置情報,特徴点情報の三つのデータを得ることができます.キャプチャ.PNG

学習画像は右側のBioID-FaceDatabase-V1.2.zip (124 MB)をクリックすることで得ることができます.このファイルには顔画像と目の位置を収録したファイルが1521個ずつ収録されています.また,特徴点の情報はFGnet Markup Scheme (500 KB)をクリックすることで得ることができます.これらはファイル名に通し番号が付与されていてその番号毎に顔画像が分かれているようです.ここで得た学習画像と特徴点情報を実際の学習データとして使います.

4.AAMの作成とFitting

モデル(AAM)の生成

AAMLibraryのsampleであるrun-build.batは以下のように記述されていました.

 build -t 0 -p 2 ../image jpg pts haarcascade_frontalface_alt2.xml my.amf
 pause

これはimageファイル内の学習データを用いるという意味です.また画像ファイルはjpg,そして特徴点ファイルはpts形式でなくてはいけません.BioID Face Databaseは奇跡的に特徴点情報がptsファイルで提供されているのでそのまま用いることができます.しかし,画像はpgmファイルなのでjpgへの変換しなくてはいけませんでした.変換は何でもよいのですがIrfanViewが楽でしたのでお勧めします.これで画像データができたので実行してみましょう.実行後はAAMデータとしてmy.amfファイルが出力されます.
*「image」フォルダは「example」フォルダと同じ階層に作製してください
* BioIDから取得したptsファイルには「bioid_1140a.pts」というファイルが存在してます.これがあると誤動作をするので消去しておくことをお勧めします.

Fitting

Fittingでは実際の顔画像にAAMのモデルを適応させ,顔画像の特徴量の取得を行います.AAMLibraryのサンプルではFittingにより得た特徴量を用いて合成された顔画像を張り付けた画像を出力していました.では,run-fit.batの中身を見てみましょう.

fit my.amf  haarcascade_frontalface_alt2.xml test.jpg
pause

これは,my.amfに記述されているモデル情報用いてtest.jpgの顔画像のFittingを行うという意味です.ここでtest.jpgは学習データ同様白黒にしてあります.結果は以下のようになりました.

キャプチャ.PNG

左が元の画像で右がFitting後の画像です.見るに堪えない感じになっていますがこれが現実です.AAMでは輝度モデルの合成が弱点となっています.ですが,鼻や目,口の位置などがぼんやりととれていることが分かります.これは形状情報は正確にとれているということです.つまりは画像の輝度情報のみから顔画像の形状情報が取れているということです.

ちなみに解像度を低くすること以下のようにFittingが失敗してしまいました.画像の解像度は学習画像とテスト画像で合わせた方が良いようですね.

キャプチャ.PNG

5.考察と問題点

今回の実験ではAAMのライブラリが実際に使えることが示された.実際に外部のライブラリを触ってみると学習が速く,Fittingも思ったより高速にできるということを再確認させられた.今後の自分のAAMの実装に生かそうと感じた.今回用いたライブラリは2Dの初めて提案された手法とRevisitedと呼ばれるLucas-Kanade法を用いた高速化手法の二つが実装されておりどちらも実行することができる.Revisitedは実装が比較的複雑であるため敬遠されがちであるのでぜひこの機に使ってみてほしい.問題点としては先ほども記述した通り輝度モデルの表現力である.輝度モデルは学習画像の輝度情報を用いているため高次元のデータとなるそのため学習データ数が少量の場合は今回のように表現力不足が生じる.よって学習データが大量に必要となるが手動で特徴付けされる学習データは大量に作り出す場合相当な労力となる.また,今回は2DAAMであったため,顔画像の傾きやオクルージョンにロバストではない.よって,3DAAMへの拡張が必要になる.まあ,これが自分の研究なんだけどね,以上

 

6
4
5

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
4