2024年09月归档_光亮毛巾的博客_RedHat/Centos,python编程,学习笔记,人工智能,DQN领域博主 – 靠谱客

光亮毛巾

文章

资源

加入时间

4年6月6天

代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果

代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果

DQN训练中，设置ε-greedy策略，一开始让智能体选择较多的随机动作，越后期，随机动作越小，这样的训练效果最好，但为什么在我的实验中，是相反的？

DQN 2024-09-17 187 点赞 2 评论 283 浏览

他的专栏

RedHat/Centos（0）

python编程（1）

学习笔记（1）

人工智能（1）

DQN（1）

他的归档

2024年09月（1）

热门文章

1

Python数字图像处理之霍夫线变换实现详解

2

Java中List集合的三种遍历实现迭代器普通for循环增强for循环使用时如何选择前言一、创建集合对象二、三种遍历实现总结

3

使用PyTorch来进展不平衡数据集的图像分类

4

代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果

立即
投稿返回
顶部