概要
Unity ML-Agentsを使い始める前に知っておくといい前提知識をまとめてみました。
※2018/12/21現在 強化学習のみ対応
用語解説
- 機械学習
大量の情報の中から規則性を見つけ、予測や判断を行うためのルールを機械に生成させる手法のこと。
機械学習にもいくつか種類があり、代表的なものには「教師あり学習」「教師なし学習」「強化学習」があります。
- 推論
与えられた情報を推論モデル(人間でいう頭脳)に判断させ、その結果を導き出すこと。
例えば囲碁の場合、推論モデルに現在の盤面情報を与え、「これが最善手だ!」と判断すれば、その最善手の座標を出力する、というのが推論の一例です。
- 強化学習
ある環境に置かれたエージェント(Agent) が環境(Enviroment) に対して行動(Action) した結果得られる報酬(Reward) が最大化されるような推論モデル を生成する手法です。
例えばサッカーの場合、ゴールしたら +1.0 ゴールされたら -1.0 の報酬を与えるとしましょう。
エージェントは、学習していく過程の中で偶然でもゴールすると報酬が与えられるため、今の行動は良い行動であると認識して少しずつ賢くなっていく、というのが強化学習の一例です。