0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

強化学習28 colaboratory+OpenAI+chainerRL 小まとめ

Last updated at Posted at 2019-12-04

(2019年12月8日にchokozainerRLを更新しています。)

 中学生から大学生までのAI初学者を対象にしています。
強化学習シリーズを27まで書いてきました。1日1個のペースだったので、約1ヶ月。
ここから始めると楽になるというような、まとめを書きます。新しいことはありません。

 手軽にGPUを使った機械学習を始めるならば、colaboratoryは無料なのでオススメです。面倒なインストールも必要ないし。
ただ、それだけでは動かないので、手順をまとめてみようということです。
フレームワークにchainerRLを選びました。tensorflowもいいのだけれど、使ったことないので、、、。
 そのうち、tensorflowも使ってみると思います。
 途中にも書きますが、できる限りソースコードを見ましょう。githubで公開されています。関数名がわかりやすいので、理解しやすいと思います。chainerは日本人が作っているためか、英語的に読みやすいです。というか、chromeで日本語訳すると、ちゃんとした日本語になります。tensorflowは、???です。
 chainerRLのラッパーであるchokozainerRLを公開しています。大したことはしていませんが、強化学習の「人間の学習」に役立てばと思います。

1 Googleアカウントを取得

こちらから作成してください。

Googleアカウントの作成
https://support.google.com/accounts/answer/27441?hl=ja

2 Colaboratoryのページを開く

こちらから開きます。
https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja
ブックマークしておきましょう。

3 chokozainerのサンプルページを開いて、自分のフォルダに保存

3-1 ノートブックを開く

open_toolbar.png

ファイル−ノートブックを開く
select_abc.png

GitHubタブを選択します。
chokozainerで検索して、
ipynbs/abc.ipynb
を選択します。

開かれたabc.ipynbは、そのままでは使えないので、ドライブにコピーを作ります。
select_save.png

そして、コピーされたファイルの名前を変更します。
change.png

4 ノートブックを実行する。

ノートブックの実行は、いろいろなサイトで詳しく説明されているので、自力でやってください。
学習前は、数ステップしかできなかったのが、学習後には設定の200ステップまでバランス取れるのがわかります。
こんな感じの動画が作られます。
videoimage.png

学習実行結果は、こんな感じです。
result.png

elapsedは実行時間(秒)なので、15分程度で学習が終了します。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?