MATLAB强化学习入门——一、多臂赌机问题四、总结 《MATLAB强化学习入门》将会是一栏系列文章,分享我在使用MatLab实现强化学习基本算法和算例中的理论学习体悟、编程实现过程以及结果分析。作为分享的开始,本文首先聊一聊强化学习的基本思想和一系列概念。随后就单步决策问题及对应模型,强化学习的几种解决方法进行讨论,包括ε-greedy策略和softmax策略。 强化学习与控制 2023-06-07 55 点赞 0 评论 83 浏览