1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Spatial Transformer Networks のメモ

Posted at

概要

  • CNN ではmax poolingとかでshift invarianceを入れているが、回転とかは弱い。(普通Data Augmentationで入れるような)

  • Spatial Transformer と呼ぶ層をCNNの中に混ぜる。この層はtrainableである。Transformerはインスタンスごとに適切な変換を行うように学習する。どうもある種の正規化みたいなことを画像に対して行うことが期待されているようだ。

  • STはConv層の間に挟む。普通に作ると全結合になりそうでパラメータ増えそうだが、どうなっているのかな?

image.png

評価

評価はMNIST, SVHN などの文字とCUB200 という鳥類画像で行っている。
基本的には分類精度の向上で評価しているようだ。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?