深入浅出强化学习:原理入门(待更新)
之前看强化学习的一些教学视频,发现自己对一些强化学习中符号的定义理解不太透彻,例如 \(Q_{target}\),\(Q值\), \(Q估计\),\(Q现实\),\(Q预测\), 现在发现郭宪老师的书,试读了一下里边的内容,发现老师讲解的很透彻,并且原理解释的很清楚,因此做此笔记。一是为了监督自己的学习进度,让自己能够在阅读的过程中,能够更深入的理解。二是做一份自己的笔记,方便后期查阅。文章内...