53

More than 5 years have passed since last update.

Convolution処理の手法　Im2Col方式の図解

Posted at 2017-07-08

先日のConvolution処理の記事「高速な Convolution 処理を目指してみた。Kn2Image方式」で　の比較対象として紹介した Im2Col 方式について図解します。

参考文献

Im2Col 方式

Im2Col方式の特徴は、行列積演算１回でConvolution処理を行うために、Source Image の画素配置を(重複ありで)変形させるところにあります。
本記事では、変形させた画素配置を col展開と呼称します。
以下、順を追って図解します。

画素配置変換 (Image → Col展開)

下図の８×６の画像を入力画像として説明していきます。
説明用に１画素のみ色を変えてあります。

フィルタは３×３です。
⑤を注目画素とします。

左上の画素を始点とします。
注目画素と近傍（３×３）を、１列にシリアライズします。
範囲外の ①②③④⑦ は 0値を格納します。

注目画素を右に移動させます。
同様に、注目画素と近傍（３×３）を、１列にシリアライズします。

同様に...

右端に達すると、

注目画素を一行下の左端に移します。

同様に...

同様に...

同様に...

同様に...

同様に...

同様に...

Sorce Image の右下の終点まで行います。

補足

Sorce Image の画素A は、Col展開上に９か所($A_1$～$A_9$)に存在します。

画素配置変換 (Col展開 → Image)

先ほどとは逆に、Col展開から Image状に戻す方法です。
逆伝播で dIn を算出する際に使用します。　
先ほどの Col展開の図を用います。

左端を開始列とします。
注目列を３ｘ３に戻します。

注目列を1つ左に移します。
注目列の３ｘ３に戻します。　
Destination Image に加算します。

同様に、注目列を1つ左に移します。
注目列の３ｘ３に戻します。　
Destination Image に加算します。

注目列が Col 展開の右端に達するまで繰り返します。

補足

Image 状に戻し終わった際、画素$A$の値は $A_1$～$A_9$ の総和となります。

MCMK × MiniBatch

チャンネルと MiniBatch の col 展開の配置を下図に示します。

順伝播

Bias 値を Out に BoradCast します。
下記の行列演算で、Convolution処理となります。

行列演算は BLAS の gemm関数がお勧めです。

逆伝播

画素の傾きdIn , Weightの傾きdW , Biasの傾き dB を順に図解します。

dIn

$dIn = Weight^T × dOut$

Col展開(dIn) は Image状に戻し、前層に伝達します。

dW

$dW = In^T × dOut$

dB

dB は Channel 毎の dOut の総和です。

補足

cudnn の Convolution関数はアルゴリズムは選択可能になっており、その中の１つがこの im2col 方式の様です。

ここまで読んで頂き、ありがとうございます。

53

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

53