はじめに
正規化手法に関する調査の2回目です。
1.Group Normalizationについて
2.[Instance Normalizationについて<--今回] (https://qiita.com/sho12333/items/0f0a26ff40f3d86d5a9d)
Instance Normalizationとは
インスタンスの正規化は、グループのサイズがチャネルサイズ(または軸のサイズ)と同じサイズであるグループ正規化の特殊なケースです。
実験結果は、バッチ正規化を置き換える場合、インスタンスの正規化がスタイル転送でうまく機能することを示しています。最近、インスタンスの正規化は、GANのバッチ正規化の代わりとしても使用されています。
https://www.tensorflow.org/addons/tutorials/layers_normalizations
正規化の種類
各サブプロットは、入力テンソルを示しています。Nはバッチ軸、Cはチャネル軸、(H、W)は空間軸(画像の高さと幅など)です。青のピクセルは、これらのピクセルの値を集計することによって計算された、同じ平均と分散によって正規化されます。
https://www.tensorflow.org/addons/tutorials/layers_normalizations
Instance Normを導入すると
1行目:Gatys et al.の手法を用いた
原画像(左)、スタイル画像(中)、変換後の画像(右)。
2行目:Ulyanov et al. (2016)の高速スタイル化手法を用いて反復回数を多く学習した場合の典型的なスタイル化結果:パディングをゼロにした場合(左)、より良いパディング手法を用いた場合(中)、パディングをゼロにしてInstance Normを行った場合(右)。
Gatys et al. (2016) methodは有名な画像のスタイル変換で用いられている手法です。 ![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/837628/37be7ee3-ba69-0688-67ff-a7494b79f309.png)
Stylizationの結果
提案手法を用いたStylizationの例.
1列目:スタイル画像、2列目:オリジナル画像とそのスタイル化されたバージョン。
かなりリアルに生成できていることが分かる。
##まとめ
バッチ正規化をインスタンス正規化に置き換えることで、画像生成のためのある種のディープニューラルネットワークの性能を劇的に向上させることが可能であることを示している。
今後画像識別にも適応していきたい。
参考文献