はじめに
NIPS2016でBest Paper Awardを受賞したValue Iteration Networksを早速使ってみる。
論文はこちら
http://papers.nips.cc/paper/6046-value-iteration-networks
今回使う著者らのgithubのコードはこちら。
https://github.com/avivt/VIN
Theanoを使っている。pythonは2.7系が必要。
今回は使わないがTensorFlow版のコードはこちら
https://github.com/TheAbhiKumar/tensorflow-value-iteration-networks
こちらはpython3.5系が必要。
パソコン環境
OS:Ubuntu 14.04
GPU:GTX 1070
CUDA 8.0 RC
cuDNN 5.1
python 2.7.6
Theano 0.8.2
Matlab 2016b
MatlabBGL
など
コードとdataの入手
まずコードをgit cloneする。
git clone https://github.com/avivt/VIN.git
data生成やtrainingのscriptはscripts/
ディレクトリにあるらしい。
make_data_gridworld_nips.m
がデータを生成するコード。Matlabのファイルとなっている。
matlab
でmatlabを立ち上げる。