1

More than 5 years have passed since last update.

@ohisama@github

強化学習のお勉強

強化学習

Last updated at 2018-12-24Posted at 2018-12-24

概要

強化学習で、問題に使用するアルゴリズムを決めたい。
学習が足りなくて、埋められない。

問題	状態空間	行動空間	方策	アルゴリズム
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack	離散	離散	あり	Sarsa
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack	離散	離散	なし	Q学習
輪投げ、射撃、ダーツ	離散	連続	あり
輪投げ、射撃、ダーツ	離散	連続	なし
倒立振子、cartpole、pendulum、mountaincar、acrobat	連続	離散	あり	PID、Fuzzy
倒立振子、cartpole、pendulum、mountaincar、acrobat	連続	離散	なし	DQN
ブロック崩し、インベーダー、pong	連続	連続	あり
ブロック崩し、インベーダー、pong	連続	連続	なし

1

Register as a new user and use Qiita more conveniently

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

1