概要
robloxでassistantやってみた。
ニューラルネットワーク、見つけたのでやってみた。
参考にしたページ
写真
調査
agentが全体でtrain
envはgame
actorはmodel
modelはnn.Sequential
入力01で goalUp goalDown goalRight goalLeft dangerUp dangerDown dangerRight dangerLeft
入力8、隠れ層256、出力4
オプチマイザーは、SGD
- nn.Linear(8, 256)
- nn.ReLU()
- nn.Linear(256, 4)
- nn.Softmax()
出力01で UP DOWN RIGHT LEFT
50回でupdate、resetボタンでストップ
ウェイト、バイアスの出力無くて、DataStoreServiceに保存
やる程、賢くなる。
以上。