概要
強化学習で、問題に使用するアルゴリズムを決めたい。
学習が足りなくて、埋められない。
問題 | 状態空間 | 行動空間 | 方策 | アルゴリズム |
---|---|---|---|---|
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack | 離散 | 離散 | あり | Sarsa |
三目並べ、迷路、テトリス、囲碁、frozenlake、オセロ、blackjack | 離散 | 離散 | なし | Q学習 |
輪投げ、射撃、ダーツ | 離散 | 連続 | あり | |
輪投げ、射撃、ダーツ | 離散 | 連続 | なし | |
倒立振子、cartpole、pendulum、mountaincar、acrobat | 連続 | 離散 | あり | PID、Fuzzy |
倒立振子、cartpole、pendulum、mountaincar、acrobat | 連続 | 離散 | なし | DQN |
ブロック崩し、インベーダー、pong | 連続 | 連続 | あり | |
ブロック崩し、インベーダー、pong | 連続 | 連続 | なし |