動作環境
GeForce GTX 1070 (8GB)
ASRock Z170M Pro4S [Intel Z170chipset]
Ubuntu 14.04 LTS desktop amd64
TensorFlow v0.11
cuDNN v5.1 for Linux
CUDA v8.0
Python 2.7.6
IPython 5.1.0 -- An enhanced Interactive Python.
gcc (Ubuntu 4.8.4-2ubuntu1~14.04.3) 4.8.4
GNU bash, version 4.3.8(1)-release (x86_64-pc-linux-gnu)
TensorFlowを使った100 input nodes, 100 output nodesの学習について検討中。
Q-learning with 2D actions and 2D states
- water flowとfan speedを調整する
- current temperatureとamount of emissionsを受け取る
Q-learningというキーワードを知った。
@Ugo-Nama さんの記事にQ-learningが詳細に紹介されている。
DQNの生い立ち + Deep Q-NetworkをChainerで書いた