Unity
機械学習
強化学習
ML-Agents

Unity ML-Agents 前提知識まとめ


概要

Unity ML-Agentsを使い始める前に知っておくといい前提知識をまとめてみました。

※2018/12/21現在 強化学習のみ対応


用語解説


  • 機械学習

大量の情報の中から規則性を見つけ、予測や判断を行うためのルールを機械に生成させる手法のこと。

機械学習にもいくつか種類があり、代表的なものには「教師あり学習」「教師なし学習」「強化学習」があります。


  • 推論

与えられた情報を推論モデル(人間でいう頭脳)に判断させ、その結果を導き出すこと。

例えば囲碁の場合、推論モデルに現在の盤面情報を与え、「これが最善手だ!」と判断すれば、その最善手の座標を出力する、というのが推論の一例です。


  • 強化学習

ある環境に置かれたエージェント(Agent)環境(Enviroment) に対して行動(Action) した結果得られる報酬(Reward) が最大化されるような推論モデル を生成する手法です。

例えばサッカーの場合、ゴールしたら +1.0 ゴールされたら -1.0 の報酬を与えるとしましょう。

エージェントは、学習していく過程の中で偶然でもゴールすると報酬が与えられるため、今の行動は良い行動であると認識して少しずつ賢くなっていく、というのが強化学習の一例です。