2023年09月归档_懦弱板栗的博客_Photoshop教程,打印外设,Windows 10,JavaScript,uniapp,数字逻辑电路课程实验,网络,Other,openresty领域博主

懦弱板栗

文章

资源

加入时间

4年6月12天

Q学习例子

假设建筑物中有5个房间，如上图所示。我们将每个房间的编号设为0到4.建筑物的外部可以被认为是一个大房间（5）。当然，5号房间的回报率为100，其他所有与目标房间的直接连接奖励为100。Q（1,5）= R（1,5）+ 0.8 * Max [] = 100 + 0.8 * 0 = 100机器人从状态2开始，我们希望他能够学习到房子外面状态5。状态列表：状态0可到达——>状态4；状态1可到达——>状态3、5；状态2可到达——>状态3；状态3可到达——&

网络 2023-09-13 183 点赞 2 评论 277 浏览

他的专栏

Photoshop教程（0）

打印外设（0）

Windows 10（2）

JavaScript（1）

uniapp（1）

数字逻辑电路课程实验（1）

网络（1）

Other（1）

openresty（1）

他的归档

2023年09月（1）

热门文章

Win10遇到共享打印机提示错误代码0x000006d9的解决方法

javascript 实现键盘上下左右功能的小例子

Win10商城极限竞速6下载后无法运行问题解决方法

深入浅析uni-app的生命周期

ALU和寄存器堆（verilog）一、ALU二、寄存器堆

Q学习例子

数据分析学习网站

OpenResty 火焰图工具