2024年09月归档_欣喜斑马的博客_Photoshop教程,Mssql,Windows 8,正则表达式,m5310采用芯片中移物联,iOS逆向,java,数据库,强化学习领域博主

欣喜斑马

文章

资源

加入时间

4年5月17天

python强化学习实例：寻路Q-Learn演示python强化学习-寻路Q-Learn演示1. 简介2 Q-Learn3. 演示4. 后记

项目包含的所有资源已经上传到GitHub，欢迎访问：https://github.com/BlueShark002/QLearn 。这是一个关于Q-Learn的寻路项目。我构建了一个方块的“世界”，里面一共有四个元素：玩家会在这个方块的小世界里按Q表移动，到达终点“E”即游戏胜利，到达"X"游戏结束。通过给与玩家的每一次移动不同的奖励，来规正玩家到达终点的路线。玩家踩到陷阱奖励-100分，到达终点奖励100分，到达空方块奖励-1分 .........

强化学习 2024-09-17 137 点赞 2 评论 207 浏览

他的专栏

Photoshop教程（0）

Mssql（0）

Windows 8（1）

正则表达式（1）

m5310采用芯片中移物联（1）

iOS逆向（1）

java（1）

数据库（1）

强化学习（1）

他的归档

2024年09月（1）

热门文章

为Windows8消费者预览版的开始菜单添加休眠功能

js正则表达式学习和总结(必看篇)

m5310采用芯片中移物联_中移物联 NB-IOT模组全网通物联网M5310-A模块共享机水表...

ARM汇编常见条件判断对应NZCV标识以及 TST / TBZ / TBNZ 指令

转 Java语言的特点 Java语言的特点

【文献翻译】七种FD发现算法（未完成）摘要1. 函数依赖关系2. FD算法概述3. 七种FD发现算法4. 评价5. 总结

python强化学习实例：寻路Q-Learn演示python强化学习-寻路Q-Learn演示1. 简介2 Q-Learn3. 演示4. 后记