はじめに
先週、unit ML-Agentsの tennisサンプルを試したみた。今週は次のサンプル GridWorldも試してみた。
unityのml-agentsでtensorflowを使った強化学習を試してみる
https://qiita.com/kznx/items/b0614b08e052bd95addf
GridWorld サンプル
ランダムに置かれた障害物を避けて、ゴールにたどり着くことを学習するサンプル。デフォルトだと障害物が一つで、エリアも5x5と小さいので、エリアを広げ、障害物の数を増やしてみた。変更点は下記の通り。
- unityの[Hierarchy]タブの[GridAcademy]を選択。
- Inspectorに表示されるgridSizeのValueを10、numObstaclesのValueを20にしてみた。
tensorboard
一応訓練は進んでいるように見えるが・・・

学習結果
今週は、GridWorldのサンプルを試してみたが、あまり賢くなってない。学習がうまく進んでないようだ。 reinforcement learning by unity ml-agents, GridWorld example https://t.co/PjTSYKSzCD via @YouTube
— Kazutoshi Nakano (@kznx) February 3, 2018
最後に
もう少しハイパーパラメータを調整しないと、学習が進まず、賢くならないようだ。