中高生から大学生までのAI初学者を対象にしています。
強化学習25までやっていたcolaboratoryを用いたやり方は、それなりに便利なのですが、それなりに面倒です。
そもそも、新しいアルゴリズムや学習方法を開発したいわけではなくて、強化学習を学びたいだけなんですよね。しかも、まず慣れたい。
そこで、こんなやり方を考えました。
ラッパーソフトとしてのchokozainerRL
chainerRLのexampleにあるものに少しだけ手を加えて、google colaboratoryで動かしやすくしました。
DQNが何であるとか、どこでchainerを使っているかなどは一切無視できます。
設定値だけをいじって、どうなるのかだけを知りたい。。。こんな人のものです。
誰かの記事に書いてありましたが、「exampleは猿プログラマーが理解できるようにするためのもの。」
とりあえずは、testpypiだけです。
これで十分な気もしますが、そのうちpypiにも移行します。
始めるの、超簡単。
colaboratoryの、
ファイル ー ノートブックを開く
の画面で、githubタブを選択します。
chokozainer
で検索して、
chokozainer/chokozainerrlリポジトリ を選択します。
すると、
ipynbsの中にあるノートブックが出てくるので、いずれかを選択してください。
これで、実行可能です。
おっさんの馬力は弱いのでゆっくり進みます。
おっさんの馬力は弱いので、ちょっとずつ足していきます。
また、あまり真面目にデバック取っていないので、少しづつ修正されていきます。