LoginSignup
6
8

More than 5 years have passed since last update.

画像認識用 DeepLearningモデルの実装

Last updated at Posted at 2016-08-24

1. はじめに

この記事ではコンピュータ上で DeepLearningプログラムを実装する方法を示します。
画像認識が目的となるので、実用的な規模の畳み込みニューラルネットワーク(CNN)の実装を行います。

2. マシンの用意

高性能なGPUが不可欠なので、Linuxマシンを推奨します。Linuxマシンの主な選択肢は以下の通りです。

  1. デスクトップPC
  2. 仮想環境(Virtual Box等)
  3. AWS(Amazon Web Service)

上記のいずれかに、 CentOSまたは Ubuntuを入れて活用しましょう。

3. GPUの設定

GPUを使用するには、CUDAとcuDNNをインストールする必要があります。
Ubuntu14.04であれば http://qiita.com/shinya_ohtani/items/f374ed0dd51737087369 を参考にします。

4. Pythonのインストール

Python本体および各種モジュールをまとめた、 Anacondaというディストリビューションを Linuxマシンにインストールします。
手順は http://morimori2008.web.fc2.com/contents/PCprograming/python/pythonAnaconda.html に書かれている通りで概ねOKです。
ただし、ここではローカルユーザにインストールすることにします。

5. DeepLearning用ライブラリ

次に、 DeepLearningモデルを構築するためのライブラリを Pythonで使えるようにします。ここでは Theanoを採用しました。
ターミナルから

$ pip install theano

と打ち、 Theanoをインストールします。

6. コードの実装

ターミナルから

$ jupyter notebook

と打つことで、 Pythonの開発環境が立ち上がります。この上でコードの実装を行います。
実装にあたり、http://deeplearning.net/tutorial が参考になります。
こちらのサイトでは CNNのソースコードも公開されており、そのまま画像認識に転用できます。

7. 今後の展望

ここまでで CNNの実装ができました。

あとは実際に用いる入力用データを集め、そのデータに向け入出力フォーマットを整えれば画像認識プログラムが完成します。

6
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
8