LoginSignup
3
6

More than 5 years have passed since last update.

【論文シリーズ】ネットワーク内包ネットワーク

Posted at

原文

ネットワーク内包ネットワーク (Network In Network)
Min Lin (2014)

1. 要約/背景

  • NIN(Network in Network)とは、入力層の活性化関数の代わりに、小さいNNを用いたモデルのことである。
  • Micro Networkの活用により、学習精度の向上と汎化誤差の低減が認められた。
  • CNNでは、高次の特徴を抽出する際、込み入った中間層の形成がポイントになるが、NINではこの効果も期待できる。

2. 骨子の理論


(1)畳込み層における変化
一般的なCNNは、畳込み層において、GLMによる線形演算をベースにプーリング層に引き渡す。

151201010150_1.JPG

一方で、NINでは、Mlpconv(Multi layer perception convolutional)層を形成して、小規模のNNのアウトプットがプーリング層へ引き渡される。

151201010150_2.JPG

1 → n層の多層NNの処理を引渡し時に行う

f^1_{i,j,k_1} = \max(w_{k_1}^1 {}^Tx_{i,j}+ b_{k_1}, 0)\\
.\\
.\\
.\\
f^n_{i,j,k_n} = \max(w_{k_n}^n {}^Tf_{i,j}^{n-1} + b_{k_n}, 0)

(2)総平均プーリング
従来CNNの全結合層に取って代わるモデル。頑健性を高める。
Mlpconvで出力した特徴ベクトルの平均を取り、それを直接ソフトマックス関数に入れ込んだ。

3. モデル適用例

頑健性という点において、精度としてDropConnectなどの手法と拮抗する感じ。
CIFAR-100のテストでは、NINにDropoutを組み合わせたモデルが最も良いパフォーマンスを出した。

151201010150_4.JPG

3
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
6