LoginSignup
0
1

More than 5 years have passed since last update.

強化学習のお勉強

Last updated at Posted at 2018-12-24

概要

強化学習で、問題に使用するアルゴリズムを決めたい。
学習が足りなくて、埋められない。

問題 状態空間 行動空間 方策 アルゴリズム
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack 離散 離散 あり Sarsa
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack 離散 離散 なし Q学習
輪投げ、射撃、ダーツ  離散 連続 あり  
輪投げ、射撃、ダーツ  離散 連続 なし  
倒立振子、cartpole、pendulum、mountaincar、acrobat   連続 離散 あり    PID、Fuzzy
倒立振子、cartpole、pendulum、mountaincar、acrobat   連続 離散 なし    DQN
ブロック崩し、インベーダー、pong  連続 連続 あり 
ブロック崩し、インベーダー、pong  連続 連続 なし 
0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1