はじめに
強化学習を中心に良記事と思われるURLを記載しました。
補足的な事項を記事として書いていこうと思います。
強化学習
- ゼロから作るDeep Learning④ 強化学習編、斎藤 康毅
- Reinforcement Learning: An Introduction Second Edition、Richard S. Sutton、Andrew G. Barto
- 強化学習のコンセプト【テーブル形式の解法】
- 方策反復法は、なぜ最適方策に収束するの?
- 縮小写像の原理から見た強化学習
- Trust Region Policy Optimization: TRPO
- Proximal Policy Optimization: PPO
逆強化学習
- 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで、久保隆宏
- 逆強化学習【線形計画】
- 逆強化学習【Maximum Entropy】