More than 5 years have passed since last update.

TECH::CAMP Advent Calendar 2016

@snowhorkin

エムスリー株式会社

環境構築から深層学習チュートリアル

Posted at 2016-12-13

昨今話題になってるディープラーニングですが、

「勉強してみたいけど、そもそも何ができるのかよくわかってない...」

そんな方に向けて、Macにおける環境構築からディープラーニング実行までの方法をご紹介します。

python環境構築

機械学習・ディープラーニングといえばpythonです。
とりあえずpythonの環境構築を整えます。まずはpythonをインストールしましょう。
ターミナルを開いて、順に実行していきましょう。

ターミナル

brew install pyenv
pyenv install anaconda3-4.0.0

これでインストール完了。

ターミナル

pyenv versions

と実行して、

* system (set by ~~~)
  anaconda3-4.0.0

こんな感じにanaconda3-4.0.0が出てくれば無事インストール成功です。

次はpyenvのパスを通します。

ターミナル

echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bash_profile
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bash_profile
echo 'eval "$(pyenv init -)"' >> ~/.bash_profile
source ~/.bash_profile

これでOK！

次に、先ほど入れたpythonのバージョンに切り替えましょう。

ターミナル

pyenv grobal anaconda3-4.0.0

これで無事切り替えられているはずです。

ターミナル

python

とターミナルに入力して実行することで、

Python 3.5.2 |Continuum Analytics, Inc.| (default, Jul  2 2016, 17:52:12)

Python 3.x.xなどと表示されていれば、切り替えに成功です。

keras導入と設定

次にディープラーニングのフレームワークで有名なkerasをインストールしましょう。ディープラーニングを１から作ろうとすると、膨大な労力がかかりますが、kerasを用いることで、１０行で実行できてしまいます。

ついでにkerasの学習結果を保存するための、h5形式を扱うライブラリも入れておきます。

pip install h5py
pip install keras

インストール完了。そのあと、若干の設定をしておきます。

ターミナル

mkdir ~/.keras
echo '{"epsilon": 1e-07, "floatx": "float32", "backend": "theano"}' >> ~/.keras/keras.json

【Tips】backendとは？

読み飛ばして全然OKです。

ところで、ディープラーニングのアルゴリズムの根底には、数学的計算などを行う必要があります。実はこの数学的計算を行ってるライブラリがbackendと呼ばれ、kerasとは別のライブラリが担っています。theanoかtensorflowのどちらかを選ぶことができて、kerasをインストールすると同時にtheanoもインストールされます。

ディープラーニング実行

お待たせいたしました。早速ディープラーニングをしていきましょう。

keras_tutorial.py

# !/usr/bin/env python
# -*- coding: utf-8 -*-

import numpy as np
import keras

from keras.utils import np_utils
from keras.datasets import mnist
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.layers.core import Activation, Dense, Dropout, Flatten

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(-1, 28, 28, 1).astype('float32')/255
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32')/255
y_train = np_utils.to_categorical(y_train, 10)
y_test = np_utils.to_categorical(y_test, 10)

model = keras.models.Sequential()
model.add(Convolution2D(nb_filter=20, nb_row=5, nb_col=5,
                        border_mode='valid',
                        input_shape=(28, 28, 1)))
model.add(Activation("relu"))
model.add(Convolution2D(nb_filter=15, nb_row=5, nb_col=5))
model.add(Activation("relu"))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.5))
model.add(Flatten())
model.add(Dense(128))
model.add(Activation("relu"))
model.add(Dropout(0.5))
model.add(Dense(10))
model.add(Activation("softmax"))
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=['accuracy'])

model.fit(x_train, y_train,  batch_size=100, nb_epoch=3, verbose=1)

score = model.evaluate(x_test, y_test, show_accuracy=True, verbose=0)

print("test-accuracy: {}".format(score[1]))

model_json_str = model.to_json()
open('model.json', 'w').write(model_json_str)
model.save_weights('weights.h5')

次のような表示が出れば、無事ディープラーニングが始めることができています。

Using Theano backend.
Epoch 1/3
 5100/60000 [=>............................] - ETA: 111s - loss: 1.2484 - acc: 0.5733

ディープラーニングの結果を確認する

さて、学習は完了しましたでしょうか。完了すると、以下のように表示されます。

test-accuracy: 0.989

これは、訓練とは全く別のデータ（テストデータ）に対して、98.9%の確率で数字を識別できているということを表してます。

これでは、どんな文字がどう判定されてるかよくわからないので、次のスクリプトを実行しましょう。

# !/usr/bin/env python
# -*- coding: utf-8 -*-

import numpy as np
import pylab
import keras

from keras.utils import np_utils
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32')/255

model = keras.models.model_from_json(open('model.json').read())
model.load_weights('weights.h5')
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=['accuracy'])

tests = x_test[:20]
labels = model.predict(tests, verbose=1)

for index, (image, label) in enumerate(zip(tests, labels)):
    pylab.subplot(4, 5, index + 1)
    pylab.axis('off')
    pylab.imshow(image.reshape(28, 28), cmap=pylab.cm.gray_r, interpolation='nearest')
    pylab.title(np.argmax(label))
pylab.show()

ここで、先ほどの学習結果が、model.jsonとweights.h5で保存されてるので、それを再読み込みしています。

以下のように結果が出てるかと思います。各数字に対してどの数字か判定したかを表しています。

入門書

いかがでしたでしょうか。

今回とにかく実行したいという方向けにスクリプトをとにかく載せさせていただきました。

これで興味を持たれてディープラーニングの勉強を始めようと思う方が一人でも増えていただけるととても嬉しいです。

最後に入門書の紹介です。

・ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装

pythonでの実装を添えて理論を理解していく形式の入門書です。実際にプログラミングしながら理解したい方には是非オススメです。

・深層学習

実装はなく、理論が主な内容ですが、理論が書いてある本の中でもかなりわかりやすく解説してくれています。基礎の内容から話題の手法まで幅広くカバーしているのが特徴です。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up