2023年06月归档_标致含羞草的博客_python编程,CSS/CSS3,打印外设,MAYA,HTML5,JavaScript,# 强化学习,spark,数学建模领域博主

标致含羞草

文章

资源

加入时间

4年6月6天

强化学习入门（六）：Q-learning系列算法3：连续动作（NAF）一、NAF算法

本文是在https://blog.csdn.net/acl_lihan/article/details/104076938的基础上进行了部分改动，加上了一点个人理解，原博客写的非常好，不妨一同查阅。普通的Q-learning比policy gradient比较容易实现，但是在处理连续动作（比如方向盘要转动多少度）的时候就会显得比较吃力。因为如果action是离散的几个动作，那就可以把这几个动作...

# 强化学习 2023-06-07 218 点赞 3 评论 330 浏览

他的专栏

python编程（0）

CSS/CSS3（0）

打印外设（0）

MAYA（0）

HTML5（0）

JavaScript（1）

# 强化学习（1）

spark（1）

数学建模（1）

他的归档

2023年06月（1）

热门文章

JavaScript面向对象之体会[总结]

强化学习入门（六）：Q-learning系列算法3：连续动作（NAF）一、NAF算法

深入理解Spark之ListenerBus监听器