はじめに
keras-rlとOpenAI Gymで breakout サンプルで強化学習したコードをベースにpacmanを試します。
https://qiita.com/kznx/items/dc269d55976f030e028e
pacman サンプル
breakoutのコードから変更した箇所は一点だけ。環境を pacman に変えただけです。
env_name=('MsPacman-v0')
トレーニング結果
デフォルトの1750000step完了には、15時間ほどかかりました。やっぱり強化学習にはGPUは必須な様です。
最近試している #keras-rl と #openaigym で強化学習。子供の頃遊んだpacman は、1750000 step 完了しても、今ひとつ上手くなってない。コードはbreakoutと共通なのは驚嘆。 reinforcement learning by openai gym, pacman sample (1750k steps) https://t.co/r6Y58PbArH via @YouTube
— Kazutoshi Nakano (@kznx) February 18, 2018
最後に
pacman サンプルを試してみました。breakout サンプルと共通のコードで学習できるのは、理解しているつもりでも、驚嘆してしまいます。