はじめに
今回はkeras-rlとOpenAI Gymで強化学習を試します。まずはサンプルのcartpoleから。
参考にしたブログ、コードなど
cartpoleサンプルについては、多くのブログ、githubを参考にさせていただきました。
http://cookie-box.hatenablog.com/entry/2017/01/15/235916
https://qiita.com/inoory/items/e63ade6f21766c7c2393
https://gym.openai.com/envs/CartPole-v0/
https://github.com/matthiasplappert/keras-rl/blob/master/examples/dqn_cartpole.py
cartpole サンプル
はまったところは一点だけ。h5pyが入っていないとエラーになる。
ImportError: `save_weights` requires h5py.
トレーニング結果
20000stepぐらいだと、まだ倒しまくるが、
#keras-rl と #opengym で強化学習。学習し始めはポールを倒しまくるwww reinforcement learning by opengym, cartpole sample (20000steps) https://t.co/vlWvOnWcmD via @YouTube
— Kazutoshi Nakano (@kznx) February 10, 2018
50000step完了すると、ほぼ安定する。
#keras-rl と #opengym で強化学習。50000 step 完了すると、ほとんど倒さなくなる WWW reinforcement learning by opengym, cartpole sample (50000 steps) https://t.co/dC0cCyI3Y1 via @YouTube
— Kazutoshi Nakano (@kznx) February 10, 2018
最後に
まずはシンプルなcartpoleを試してみました。次は atari breakoutです。now on training. coming soon!