喜悦白昼

文章
7
资源
0
加入时间
3年0月21天

MATLAB强化学习入门——二、网格迷宫、Q-learning算法、Sarsa算法一、多步决策问题和网格迷宫二、 Windy Grid World的编程实现三、 Q-Learning算法总结

本文为《MatLab强化学习入门》系列的第二篇。在解决了单步决策问题以后,我们可以将多步问题分解为多个单步问题进行处理。使用ε-greedy等策略的基础在于对智能体当前的状态有良好的估计。如何对不同的状态均形成良好的估计呢,Q学习应运而生。本文将主要介绍Q-Learning的一系列基本算法,包括Q-Learning、Sarsa、Sarsa-λ算法;分析网格迷宫的编程实现,并对结果进行讨论。