MATLAB强化学习实战(十一) 使用自定义训练循环训练强化学习策略环境策略训练设置自定义训练循环仿真自定义训练函数损失函数帮助函数
使用自定义训练循环训练强化学习策略环境策略训练设置自定义训练循环仿真自定义训练函数损失函数帮助函数此示例显示如何为强化学习策略定义自定义训练循环。 您可以使用此工作流程通过您自己的自定义训练算法来训练强化学习策略,而不是使用Reinforcement Learning Toolbox™软件中的内置智能体之一。使用此工作流程,您可以训练使用以下任何策略和值函数表示形式的策略。rlStochasticActorRepresentation —随机行动者表示rlDeterministicActor