2023年06月归档_霸气泥猴桃的博客_ASP.NET编程,Linux系统,JavaScript,XML/XSLT,Linux服务器,优化技巧,强化学习,单片机,计算机组成原理,C++,运维领域博主

霸气泥猴桃

文章

资源

加入时间

4年6月12天

Q-learning算法实现1（matlab）

算法伪代码：得到Q表后，根据如下算法选择最优策略：以机器人走房间为例，代码实现如下：原文链接如下：https://www.jianshu.com/p/29db50000e3f注：原文中的房间状态0-5分别对应代码中1-6%机器人走房间Q-learning的实现%% 基本参数episode=100; %探索的迭代次数alpha=1;%更新步长gamma=0.8;...

强化学习 2023-06-22 251 点赞 3 评论 380 浏览

他的专栏

ASP.NET编程（1）

Linux系统（0）

JavaScript（0）

XML/XSLT（0）

Linux服务器（2）

优化技巧（1）

强化学习（1）

单片机（1）

计算机组成原理（1）

C++（1）

运维（1）

他的归档

2023年06月（1）

热门文章

ASP.NET 修复 IIS 映射具体实现步骤

APACHE支持.htaccess伪静重写出错 No input file specified的解决方案

sql语句中where和having的区别

阿里云 CentOS7.4 安装 Python3.6的方法讲解

Q-learning算法实现1（matlab）

使用插值法公式组成数字电路进行计算的计算机

计算机组成原理--基于Logisim的4位并行加法器实验的应用（超详细/设计/实验/作业/练习）课程名：计算机组成原理

C++编译

Docker第三课