PCANetを実装してみた

Last updated at 2017-01-05Posted at 2016-12-15

PCANetというニューラルネットワークを実装しました。

PCANetの概要

PCANetはその名の通り，ネットワークの重みをPCA(主成分分析)によって計算するCNNの一種です。

利点

PCANetには次のような特徴があります。

PCAで重みを計算するため学習が非常に高速である
PCANetそのものの学習は教師ラベルを必要としない
調整が必要なハイパーパラメータが無い
モデルが比較的単純なため実装しやすい

教師ラベルを必要としない

PCANetは，画像から切り出したパッチをベクトルとみなし，その主成分をネットワークの重みとしています。
一般的なCNNでは，目標とする出力とネットワークの出力の差をネットワーク全体に逆伝搬することで学習を行っています。一方でPCANetは画像さえ与えられればあとはPCAをかけるだけで学習ができてしまうため，教師ラベルを必要としません。

欠点

モデルが線形な演算やヒストグラム計算のみで構成されているため，非線形なモデルと比べると表現力は劣るようです。例えばCIFAR10での識別精度は80%に達していません。

「DeepLearningやるほどの計算量が無い，でもHoGだと精度が悪い」などというときにはPCANetを使うといいかもしれません。

実装について

論文中にわからない部分がある

We then subtract patch mean from each patch

とありますが，データセット内の全ての画像から抽出したパッチの平均なのか，それとも画像1枚ごとに抽出したパッチの平均なのかがわかっていません．私は画像間の輝度差を消せるので多分後者だろうと思っています。

mini-batchが使えない

PCAは基本的にバッチ処理なので，mini-batchのようにデータを小さなバッチに切り分けて学習することができません。このため非常に大きなデータを使って学習する際はメモリが足りなくなってしまいます。
実装上の解決策として，

逐次学習可能なPCAを使う
mini-batchの各バッチに対してPCAを適用し，各バッチの主成分の和を重みとする

などが考えられるため，今後必要に応じて改善していきます。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up