More than 3 years have passed since last update.

【G検定対策】畳み込みニューラルネットワーク (CNN)

Last updated at 2022-03-05Posted at 2022-03-04

畳み込みニューラルネットワーク (CNN)とは

ディープニューラルネットワークの1種．画像認識に応用するために改良され，高い認識性能を達成できるモデルである．

人間が持つ視覚神経の上記2つの働きを模したもの．これらを最初に取り入れたのは，福島邦彦らによって考案されたネオコグニトロンと呼ばれるモデルになる．後に，ヤン・ルカンによってLeNetが考案される．LeNetは誤差逆伝播法を用いている．

フィルタ(カーネル)を用いて，積和演算と活性化関数の処理を行う畳み込み層を経る．画像から特徴抽出し，特徴マップ(小さな画像)へ変換される．この畳み込み処理は，局所受容野に対応し，物体の移動を認識(移動不変性の獲得)することができる．

決められたルールに従い，演算を行う．

サブサンプリング(ダウンサンプリング)：決められたルールに従い，画像サイズを小さくする．
最大値プーリング(max pooling)：ある一定の小領域内の最大値を抽出し，サブサンプリング画像(特徴マップ)を得ること．
⇢ cf ) 平均値プーリング

特徴マップをフラットに並べる処理のこと．

特徴マップの平均値を1つのユニット(ニューロン)の値にする処理．最近のCNNの手法として．全結合層を用いずこれを行うことが多い．

ILSVRC2012にて，ジェフェリー・ヒントン率いるチームが開発したSuperVisionが圧勝．用いられたニューラルネットワークはAlexNet（8層）．⇢DeepLearningが一気に脚光を浴びるきっかけ

畳み込み層⇢畳み込み層⇢プーリング層の塊を繰り返し，16層まで積層する．少ない層で学習した後，途中に畳み込み層を追加して深くする学習方法を採用．

同時に異なるサイズのフィルタの畳み込み処理を行うInceptionモジュールを導入．

ILSVRC2015にて，ResNet（152層）が優勝．Skip connectionという 「層を飛び越えた結合」 を加えた．

その他の応用形
⇢ NASNet，MnasNet，EfficientNet(転移学習に有効なモデル)