python强化学习实例:寻路Q-Learn演示python强化学习-寻路Q-Learn演示1. 简介2 Q-Learn3. 演示4. 后记
项目包含的所有资源已经上传到GitHub,欢迎访问:https://github.com/BlueShark002/QLearn 。这是一个关于Q-Learn的寻路项目。我构建了一个方块的“世界”,里面一共有四个元素:玩家会在这个方块的小世界里按Q表移动,到达终点“E”即游戏胜利,到达"X"游戏结束。通过给与玩家的每一次移动不同的奖励,来规正玩家到达终点的路线。玩家踩到陷阱奖励-100分,到达终点奖励100分,到达空方块奖励-1分 .........