2023年06月归档_动听茉莉的博客_正则表达式,Windows xp,Windows 7,ASP.NET编程,电脑硬件,Apple Mac,Java,MATLAB怎么用命令找模块,硬件,强化学习,Java SE,php怎么获取当前年月,rabbitmq领域博主

动听茉莉

文章

资源

加入时间

4年6月2天

利用MATLAB的强化学习工具箱实现Q-Learning和SARSA算法

在网格世界（Grid World）环境中训练强化学习Agent（代理人）此示例显示了如何通过训练Q-learning和SARSA代理人来使用强化学习来解决网格世界环境。有关这些代理的更多信息，请分别参阅Q-Learning代理和SARSA代理。此网格世界环境具有以下配置和规则：一个由边界界定的5 x 5网格世界，有4种可能的动作（北= 1，南= 2，东= 3，西= 4）。代理从单元格[2,1]（第二行，第一列）开始。如果代理人到达单元格[5,5]的最终状态（蓝色），则代理商会获得+10的奖励。

强化学习 2023-06-07 238 点赞 3 评论 360 浏览

他的专栏

正则表达式（0）

Windows xp（0）

Windows 7（0）

ASP.NET编程（0）

电脑硬件（0）

Apple Mac（0）

Java（2）

MATLAB怎么用命令找模块（1）

硬件（1）

强化学习（1）

Java SE（1）

php怎么获取当前年月（1）

rabbitmq（1）

他的归档

2023年06月（1）

热门文章

使用迭代器Iterator遍历Collection

MATLAB怎么用命令找模块,使用 MATLAB Function 模块创建自定义功能

硬件电路设计之与非门触发器74HC30和74HCT20

利用MATLAB的强化学习工具箱实现Q-Learning和SARSA算法

Surpass Day9——Java 多态、final关键字、常量、package、import、访问控制权限修饰符1、多态2、final关键字3、常量4、package5、import6、访问控制权限修饰符

Resin4 日志配置

php怎么获取当前年月,PHP获取当前月份的前一个月、后一个月

Java面试题消息队列