强化学习 | 蘑菇书阅读笔记 | 第三章 表格型方法一、有模型和免模型二、Q表格三、免模型预测 策略最简单的是查找表(look up table),即表格型方法(tarbular method),如MC,Q-learning和sarsa。 python 2024-04-30 52 点赞 0 评论 78 浏览