OpenAI Gymで参考になった資料やライブラリをまとめていきます.
何かしらの役に立ちそうでしたら幸いです.
本家
◇ OpenAI Gym
- https://gym.openai.com/), Brockman et al., 2016.
あと,下記ページに各種アルゴリズムの問題ごとのスコア一覧が記載されていて参考になります.
講義資料
◇ Reinforcement Learning: An Introduction
- http://people.inf.elte.hu/lorincz/Files/RL_2006/SuttonBook.pdf
- 英語で450ページ以上ありますが,丁寧な説明となっています.
◇ UCL Course on RL, Silver, 2015.
- http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
- University College Londonの講義資料
◇ Markov Decision Processes and Reinforcement Learning
- https://s3.amazonaws.com/ml-class/notes/MDPIntro.pdf
- Author: J.Sholz
- 行動価値観数$Q$からQ学習の導出あり.
◇ RL and MDP
- https://www.cs.cmu.edu/~avrim/ML14/lect0326.pdf
- Reinforcement learning and Markov Decision Processes (MDPs)
◇ Awsome-RL
- 動画での解説からコードまで非常に充実しているサイトです.
- http://aikorea.org/awesome-rl/
まとめや流れサイト
◇ Tutorial: Deep Reinforcement Learning, Silver, 2016.
- http://icml.cc/2016/tutorials/deep_rl_tutorial.pdf
- DeepMindの人の深層教科学習の説明.
- 強化学習の基礎は知っている前提
◇ 強化学習で参考になったサイトまとめ
- http://qiita.com/eve_yk/items/2ace6d4c1dad7e912df1
- 一番参考になった気がします.
◇ 深層強化学習の動向 / survey of deep reinforcement learning
- https://speakerdeck.com/takuseno/survey-of-deep-reinforcement-learning
- Seno et al., 2017.
- 強化学習の初歩から最先端の研究資料まで網羅
論文関連
◇ Arixiv Sanity Preserver
- Arixivの人気の高い論文を検索しやすいので重宝しています.
- http://www.arxiv-sanity.com/toptwtr
ライブラリ
◇ Keras
関数近似部分を書くのが楽です.
◇ Keras-RL
Kerasで書かれた強化学習ライブラリです.
多くの深層教科学習のアルゴリズムが揃っています.
色々と動かない気がするので,お試しで使うにはありかもしれません.
◇ Chainer
日本語で教科学習のブログを書いている人は,Chainerで書いている人が多い気がします.