1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Unity ML-Agents で模倣学習やってみた

Posted at

模倣学習やってみたです。コードはこちら

模倣学習とは?

人が操作した内容を基に学習することで、難しい内容でも学習を早く進められるというものです。

やったこと

エージェントが反時計回りにぐるぐるまわれるようにすることです。
bandicam-2020-10-10-20-24-48-884.gif

模倣内容は?

自分自身の操作で、反時計回りに5周ほど回してあげたものをデモとしています。

結果

水色:模倣あり
青色:模倣なし

学習グラフ

模倣ありのほうが早く学習していることがわかります。
bandicam 2020-10-11 20-19-25-482.jpg

模倣ありは効率的

Extrinsic も Curiosity も、両方とも模倣ありのほうが早く良い報酬が得られるようになっていることがわかります。
bandicam 2020-10-11 20-22-18-812.jpgbandicam 2020-10-11 20-22-13-970.jpg

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?