qlearning算法_强化学习系列Q Learning
上一篇介绍了强化学习的一些基本概念强化学习系列--概念介绍(Introduction to Reinforcement Learning),今天我们讲解一个简单且经典的强化学习算法:Q-Learning。背景按照不同分类标准,Q Learning可以被分为:model-free,off-policy,value-based,TD等类别。Q Learning算法思想主要是去学习一个纵坐标为...