畳み込みニューラルネットワーク
フィルターをニューラルネットワークに応用として、フィルターを使ったニューラルネットワークを畳み込みニューラルネットワーク、または、コンボリューションニューラルネットワーク (Convolution Nueral Network:CNN)と呼ぶ。
フィルターに当てはめる数値によって、様々な画像処理ができますが、CNNでは、そのフィルター自体を学習させる。
まず、フィルター8枚を使った単純なCNNを作り、入力画像に対して、大きさ3×3、パディング1、ストライド1のフィルターを8枚適用する。1枚のフィルターの出力は28×28の配列となるので、全部で28×28×8の3次元配列となるが、これを1次元の長さ6272の配列に展開し、全結合で10個の出力層ニューロンに結合する。
import numpy as np
np.random.seed(1)
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras.optimizers import Adam
import time
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000, 28, 28, 1)
x_train = x_train.astype('float32')
x_train = x_train / 255
num_classes = 10
y_train = to_categorical(y_train, num_classes)
x_test = x_test.reshape(10000, 28, 28, 1)
x_test = x_test.astype('float32')
x_test = x_test / 255
y_test = to_categorical(y_test, num_classes)
# Sequentialモデルの作成
model = Sequential()
model.add(Conv2D(8, (3, 3), padding='same', input_shape=(28, 28, 1), activation='relu'))
model.add(Flatten())
model.add(Dense(10, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])
# 学習
startTime = time.time()
history = model.fit(x_train, y_train, batch_size=1000, epochs=20, verbose=1, validation_data=(x_test, y_test))
# モデル評価
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
calculation_time = time.time() - startTime
print("Calculation time:{0:.3f} sec".format(calculation_time))
def show_prediction():
n_show = 96
y = model.predict(x_test)
plt.figure(2, figsize=(12, 8))
plt.gray()
for i in range(n_show):
plt.subplot(8, 12, i + 1)
x = x_test[i, :]
x = x.reshape(28, 28)
plt.pcolor(1 - x)
wk = y[i, :]
prediction = np.argmax(wk)
plt.text(22, 25.5, "%d" % prediction, fontsize=12)
if prediction != np.argmax(y_test[i, :]):
plt.plot([0, 27], [1, 1], color='cornflowerblue', linewidth=5)
plt.xlim(0, 27)
plt.ylim(27, 0)
plt.xticks([], "")
plt.yticks([], "")
show_prediction()
plt.show()
96個の中で誤認したのはたった2つになった。
学習で獲得した8枚のフィルターも見ていく。
import numpy as np
np.random.seed(1)
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras.optimizers import Adam
import time
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000, 28, 28, 1)
x_train = x_train.astype('float32')
x_train = x_train / 255
num_classes = 10
y_train = to_categorical(y_train, num_classes)
x_test = x_test.reshape(10000, 28, 28, 1)
x_test = x_test.astype('float32')
x_test = x_test / 255
y_test = to_categorical(y_test, num_classes)
# Sequentialモデルの作成
model = Sequential()
model.add(Conv2D(8, (3, 3), padding='same', input_shape=(28, 28, 1), activation='relu'))
model.add(Flatten())
model.add(Dense(10, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])
# 学習
startTime = time.time()
history = model.fit(x_train, y_train, batch_size=1000, epochs=20, verbose=1, validation_data=(x_test, y_test))
# モデル評価
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
calculation_time = time.time() - startTime
print("Calculation time:{0:.3f} sec".format(calculation_time))
def show_prediction():
n_show = 96
y = model.predict(x_test)
plt.figure(2, figsize=(12, 8))
plt.gray()
for i in range(n_show):
plt.subplot(8, 12, i + 1)
x = x_test[i, :]
x = x.reshape(28, 28)
plt.pcolor(1 - x)
wk = y[i, :]
prediction = np.argmax(wk)
plt.text(22, 25.5, "%d" % prediction, fontsize=12)
if prediction != np.argmax(y_test[i, :]):
plt.plot([0, 27], [1, 1], color='cornflowerblue', linewidth=5)
plt.xlim(0, 27)
plt.ylim(27, 0)
plt.xticks([], "")
plt.yticks([], "")
# 表示
plt.figure(1, figsize=(12, 2.5))
plt.gray()
plt.subplots_adjust(wspace=0.2, hspace=0.2)
plt.subplot(2, 9, 10)
id_img = 12
x_img = x_test[id_img, :, :, 0]
img_h = 28
img_w = 28
x_img = x_img.reshape(img_h, img_w)
plt.pcolor(-x_img)
plt.xlim(0, img_h)
plt.ylim(img_w, 0)
plt.xticks([], "")
plt.yticks([], "")
plt.title("Original")
w = model.layers[0].get_weights()[0]
max_w = np.max(w)
min_w = np.min(w)
for i in range(8):
plt.subplot(2, 9, i + 2)
w1 = w[:, :, 0, 1]
w1 = w1.reshape(3, 3)
plt.pcolor(-w1, vmin=min_w, vmax=max_w)
plt.xlim(0, 3)
plt.ylim(3, 0)
plt.xticks([], "")
plt.yticks([], "")
plt.title("%d" % i)
plt.subplot(2, 9, i + 11)
out_img = np.zeros_like(x_img)
# フィルター処理
for ih in range(img_h - 3):
for iw in range(img_w - 3):
img_part = x_img[ih:ih + 3, iw:iw + 3]
out_img[ih + 1, iw + 1] = np.dot(img_part.reshape(-1), w1.reshape(-1))
plt.pcolor(-out_img)
plt.xlim(0, img_h)
plt.ylim(img_w, 0)
plt.xticks([], "")
plt.yticks([], "")
plt.show()