概要
自動運転シミュレーションを開発している。
プラットホームは、Plunker。
言語は、javascript。
仕組み
- 環境とagentの組み合わせ。
環境は、閉じたサーキット。
画面の下にある5つのグレーがセンサーです。
ちなみに、aは、回転角、xyzは、座標です。
100ミリ秒毎にagentが呼び出されて、アクションを求められます。
その際、センサーの値だけが送られます。
r = agent.get_action(observation, reward, done);
observation: [255, 255, 0, 0, 0]
reward: 1.0
done: false
その値でagentがアクションを返します。
アクションは、2が真っ直ぐ、0が右、1が左です。
agentの開発
observationを見て、アクションを返します。
このサンプルには、tesorflow.jsが組み込まれています。
成果物
自動運転シミュレーションは、こちら
ハンドルのアクションを追加しました。
以上。