强化学习笔记（一）强化学习基本概念强化学习笔记目录什么是强化学习强化学习的基本元素强化学习的分类

86 阅读 0 评论 57 点赞

强化学习笔记目录

什么是强化学习

强化学习是一类基于最大化奖励的决策算法。

面临的主要困难

序贯决策过程

智能体在特定环境中产生一系列的动作，而这些动作会改变智能体的状态。

强化学习与其他机器学习算法的区别

强化学习的基本元素

强化学习的分类

从得到最优决策的方法分类

不借助价值函数和策略函数，通常依赖于模型

从决策与数据的交互看

不依赖模型，智能体使用最新的策略

利用模型或收集的观测数据进行训练

从是否有模型看

利用模型或模型生成的数据训练，可能需要利用观测数据构造模型

直接利用观测数据训练价值或策略

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

强化学习笔记（一）强化学习基本概念强化学习笔记目录什么是强化学习强化学习的基本元素强化学习的分类

强化学习笔记目录

什么是强化学习

面临的主要困难

序贯决策过程

强化学习与其他机器学习算法的区别

强化学习的基本元素

强化学习的分类

从得到最优决策的方法分类

从决策与数据的交互看

从是否有模型看

强化学习笔记（一）强化学习基本概念强化学习笔记目录什么是强化学习强化学习的基本元素强化学习的分类

强化学习笔记目录

什么是强化学习

面临的主要困难

序贯决策过程

强化学习与其他机器学习算法的区别

强化学习的基本元素

强化学习的分类

从得到最优决策的方法分类

从决策与数据的交互看

从是否有模型看