Help us understand the problem. What is going on with this article?

強化学習5 CartPoleをプログラミングしてみる?

More than 1 year has passed since last update.

強化学習4までが終了していることが前提になります。

簡単なプログラミングをしてみます。

CartPole2.py
import gym
env = gym.make('CartPole-v0')
for i in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        action = 0
        if observation[2]>0:
            action = 1
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode{} finished after {} timesteps".format(i, t+1))
            break
env.close()

CartPole.pyはランダムに動いていました。
CartPole.pyとの違いは、observationの違いで、actionを変えているいことです。feedback制御になります。

chokozainer
中高生のためのDeepLearningのTips。自分の子供のために準備したものです。
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away