# -*- coding: utf-8 -*-
import gym
import time
env = gym.make('CartPole-v0')
observation = env.reset()
print(observation)
print("env actionspace:")
print(env.action_space)
print("env observationspace:")
print(env.observation_space)
print(env.observation_space.high)
print(env.observation_space.low)
count = 0
for t in range(100):
#随机选择一个动作
action = env.action_space.sample()
#执行动作 获取环境反馈
observation, reward, done, info = env.step(action)
#如果玩死了就退出
if done:
break
env.render()
count+=1
time.sleep(0.2)
print(count)
效果图:
转载于:https://www.cnblogs.com/bonelee/p/9149608.html
最后
以上就是潇洒吐司最近收集整理的关于gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了...的全部内容,更多相关gym强化学习入门demo——随机选取动作内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复