(2019年12月8日にchokozainerRLを更新しています。)
中学生から大学生までのAI初学者を対象にしています。
強化学習シリーズを27まで書いてきました。1日1個のペースだったので、約1ヶ月。
ここから始めると楽になるというような、まとめを書きます。新しいことはありません。
手軽にGPUを使った機械学習を始めるならば、colaboratoryは無料なのでオススメです。面倒なインストールも必要ないし。
ただ、それだけでは動かないので、手順をまとめてみようということです。
フレームワークにchainerRLを選びました。tensorflowもいいのだけれど、使ったことないので、、、。
そのうち、tensorflowも使ってみると思います。
途中にも書きますが、できる限りソースコードを見ましょう。githubで公開されています。関数名がわかりやすいので、理解しやすいと思います。chainerは日本人が作っているためか、英語的に読みやすいです。というか、chromeで日本語訳すると、ちゃんとした日本語になります。tensorflowは、???です。
chainerRLのラッパーであるchokozainerRLを公開しています。大したことはしていませんが、強化学習の「人間の学習」に役立てばと思います。
1 Googleアカウントを取得
こちらから作成してください。
Googleアカウントの作成
https://support.google.com/accounts/answer/27441?hl=ja
2 Colaboratoryのページを開く
こちらから開きます。
https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja
ブックマークしておきましょう。
3 chokozainerのサンプルページを開いて、自分のフォルダに保存
3-1 ノートブックを開く
GitHubタブを選択します。
chokozainerで検索して、
ipynbs/abc.ipynb
を選択します。
開かれたabc.ipynbは、そのままでは使えないので、ドライブにコピーを作ります。
4 ノートブックを実行する。
ノートブックの実行は、いろいろなサイトで詳しく説明されているので、自力でやってください。
学習前は、数ステップしかできなかったのが、学習後には設定の200ステップまでバランス取れるのがわかります。
こんな感じの動画が作られます。
elapsedは実行時間(秒)なので、15分程度で学習が終了します。