More than 5 years have passed since last update.

Unity ML-Agents 前提知識まとめ

Posted at 2018-12-21

概要

Unity ML-Agentsを使い始める前に知っておくといい前提知識をまとめてみました。

※2018/12/21現在　強化学習のみ対応

大量の情報の中から規則性を見つけ、予測や判断を行うためのルールを機械に生成させる手法のこと。

機械学習にもいくつか種類があり、代表的なものには「教師あり学習」「教師なし学習」「強化学習」があります。

与えられた情報を推論モデル(人間でいう頭脳)に判断させ、その結果を導き出すこと。

例えば囲碁の場合、推論モデルに現在の盤面情報を与え、「これが最善手だ！」と判断すれば、その最善手の座標を出力する、というのが推論の一例です。

ある環境に置かれたエージェント(Agent) が環境(Enviroment) に対して行動(Action) した結果得られる報酬(Reward) が最大化されるような推論モデル を生成する手法です。

例えばサッカーの場合、ゴールしたら +1.0 ゴールされたら -1.0 の報酬を与えるとしましょう。

エージェントは、学習していく過程の中で偶然でもゴールすると報酬が与えられるため、今の行動は良い行動であると認識して少しずつ賢くなっていく、というのが強化学習の一例です。