MATLAB强化学习工具箱(十一)训练DDPG智能体控制飞行机器人飞行机器人模型创建集成模型动作与观察创建环境接口重置函数创建DDPG智能体训练智能体DDPG智能体仿真
训练DDPG智能体控制飞行器飞行机器人模型创建集成模型动作与观察创建环境接口重置函数创建DDPG智能体训练智能体DDPG智能体仿真本示例说明如何训练深度确定性策略梯度(DDPG)智能体,并为飞行机器人生成轨迹。飞行机器人模型此示例的强化学习环境是飞行机器人,其初始条件围绕半径为15 m的圆环随机化。 机器人的方向也是随机的。 机器人具有安装在主体侧面的两个推进器,用于推动和操纵机器人。 训练的目标是将机器人从初始状态驱动到面向东方的原点。打开模型mdl = 'rlFlyingRobotEnv';