基于matlab的Qlearning强化学习室内路径规划控制算法仿真1.算法概述

336 阅读 0 评论 222 点赞

我是靠谱客的博主欢喜凉面，这篇文章主要介绍基于matlab的Qlearning强化学习室内路径规划控制算法仿真1.算法概述，现在分享给大家，希望可以做个参考。

1.算法概述

2.仿真效果

3.MATLAB仿真源码

1.算法概述

强化学习与监督学习不同之处在于,它不需要教师信号,又不同于仅能完成极其有限功能的无监督学习在学习过程中得不到任何提示,它强调与环境的交互过程中获得评价性反馈信号,利用评价信息来实现行为决策的优化。它采用人类和动物学习中的“行动—评价—改进”机制,与动物学习理论、认知科学、自动学习机等有密切的关系,对于求解无法获得教师信号的复杂优化与决策问题具有更广泛的应用前景,近年来在人工智能研究领域受到了国内外学者越来越多的重视。鉴于运动平衡控制问题对于机器人主体研究的重要性,我们对运动平衡控制技能的认知问题进行了特别的研究。

假设我们的楼层内共有5个房间，房间之间通过一道