爱笑白猫的博客_电脑常识,摄影教程,CorelDraw教程,Windows 7,php,机器学习领域博主

爱笑白猫

文章

资源

加入时间

3年0月21天

深度强化学习中的NAF算法-连续控制（对DQN的改进）

DQN算法以及之前的种种改进都是面向离散的action的，DQN算法没有办法面向连续的action，因为Q值更新的时候要用到求最大的action。本来DQN主要是输出Q值的，aciton是通过argmax顺便实现的，但是现在NAF需要用神经网络输出了，那么就是同时输出Q 和 a。基本的idea就是引入了Advantage函数A（s,a），也就是每一个动作在特定状态下的优劣。

机器学习 2023-06-22 54 点赞 0 评论 81 浏览

php自带方法吗

本文主要是关于php自带方法吗和相关实例

php 2022-11-23 62 点赞 0 评论 93 浏览

win7删除文件提示该文件太大无法放入回收站

win7系统删除文件时提示该文件太大无法放入回收站怎么办分享给大家,大家都知道，win7系统中的回收站是让我们暂存电脑中不需要的删除文件，

Windows 7 2022-04-02 146 点赞 2 评论 221 浏览

他的专栏

电脑常识（0）

摄影教程（0）

CorelDraw教程（0）

Windows 7（1）

php（1）

机器学习（1）

他的归档

2023年06月（1）

2022年11月（1）

2022年04月（1）