漂亮钥匙的博客_python编程,JavaScript,PHP编程,李弘毅深度强化学习笔记领域博主

漂亮钥匙

文章

资源

加入时间

4年5月22天

【李弘毅深度强化学习】 5.Q-learning (Continuous Action)

Q Learning是一种很好的方法，但是q learning很难处理连续动作的情况。因为q学习是基于值得，如果动作连续，q表太大，则很难计算。但是凡是问题都有解决的方法，如何解决Q Learning难以应对连续动作得问题呢！解决方法一：在连续得动作中，我们sample采样出一部分n个，将其变成有限动作的问题。但是这种方法的缺点就是采样不完整，可能会造成以后的问题解决方法二：我们用...

李弘毅深度强化学习笔记 2023-09-12 181 点赞 2 评论 274 浏览

[PHP] 《PHP边学边教》(01.开篇——准备工作)

先自我介绍一下吧，我叫海霆，英文名Hetty，我的爱好是……好了，打住，还是跳过吧，免得被人骂的，呵呵。　　也

PHP编程 2022-04-08 282 点赞 4 评论 427 浏览

很可爱的输入框

<!DOCTYPEhtmlPUBLIC"- W3C DTDXHTML1 0Transitional EN""http: www w3 org TR xhtml1 DTD xhtml1-transitio

JavaScript 2022-04-08 252 点赞 3 评论 381 浏览

他的专栏

python编程（0）

JavaScript（1）

PHP编程（1）

李弘毅深度强化学习笔记（1）

他的归档

2023年09月（1）

2022年04月（2）