【论文翻译】A Comprehensive Survey on Safe Reinforcement Learning
本篇译文为方便自己再次阅读而记录,源自Google翻译和CNKI翻译助手。习惯用语保持英文(例:agent),一些细微之处结合自己理解稍加修改,为方便阅读,译文删除了参考文献相关部分。才疏学浅,未读懂或不确定处在[ ]内附英文原文,欢迎大家指正,有任何侵权或者不妥之处请及时告知,将尽快处理。摘要安全强化学习可以定义为在学习和/或部署过程中确保合理的系统性能和/或尊重安全约束很重要的问题的回报期望最大化的学习策略的过程。 我们对安全强化学习的两种方法进行分类和分析。 第一个是基于最优性标准的修..