TL;DR
- Colaboratory で、ChainerRL を動かして、DQN のサンプルを動かした
- ALEの環境を使って、breakout のゲームを学習した
- https://colab.research.google.com/drive/1FHHHQJ1vVfG2w2ID8D9oEcuLX5qt_uek
Atariのゲームを学習させたい
前回では、CarPole を動かしていましたが、それではちょっとつまらないですね。
せっかく強化学習をするのですが、DQNを使って、Atariのゲームをやって見ます。
Colaboratory
夢のような(略
動かし方は、ChainerRL を Colaboratory で動かす を参照してください。
今回のノートは以下のURLですので、以下を開いて、コピーし、作業してください。
基本的な解説は上記のノートに書いてあります。
工夫したところ
今回は、Open AI Gym ではなく、ChainerRL の chainerrl.envs.ale の環境を使っているのが大きな違いです。chainerrl.envs.ale には、render() が実装されていなかったので、前回の方法でアニメーション作成はできませんでした。
代わりに、aleには、getSreenRGB() があるので、それを使って、アニメーションを作成しています。
Chainer Colab Notebook リポジトリ
Chainer Communityでは、Colaboratory を使った Hands-on 資料を作成しています。Contribution も受け付けていますので、Github の Pull-requestからお願いします!
@keisuke-umezawa さんによる紹介記事: https://qiita.com/keisuke-umezawa/items/4e99c2a4f5f07567444c
Google drive: https://drive.google.com/drive/u/0/folders/1GdwW9HmKfKfo6E-K81YKuURh-XheCGDR
Github: https://github.com/chainer-community/chainer-colab-notebook