【RL从入门到放弃】【二十一常见模型分析】
在RL里面重要且比较容易被忽视的一环是ENv,为什么重要,因为env是对实际情况的理解,尤其是输入特征和reward的定义直接影响最终的结果。而网上的很多关于RL的知识点,都主要在涉及agent上,所以对这个基础的东西是忽略掉了的。迷宫游戏游戏规则:探索者从红色的初始位置以最少的step到达天堂Env提供的数据Initial:在红色位置为初始化位置States: 当前...