2023年09月归档_眯眯眼月饼的博客_Apple Mac,Linux系统,PHP编程,笔记,深度强化学习入门,golang,二分图匹配领域博主

眯眯眼月饼

文章

4

资源

0

加入时间

4年6月6天

【深度强化学习】6. Q-Learning技巧及其改进方案

【DataWhale打卡】第四次任务，主要是重新学习一下李宏毅的Q-learning部分的知识，推导很多。之前看的时候就是简单过了一遍，很多细节没有清楚。这篇笔记包括了李宏毅深度强化学习三个视频长度的内容。文章目录1. 概念/解释2. Value Function3. State-Action Value Function4. TIP: Target Network5. TIP: Exploration6. TIP: Experience Replay7. DQN7.1. Double DQN

深度强化学习入门 2023-09-12 197 点赞 2 评论 298 浏览

他的专栏

Apple Mac（0）

Linux系统（0）

PHP编程（0）

笔记（1）

深度强化学习入门（1）

golang（1）

二分图匹配（1）

他的归档

2023年09月（1）

热门文章

1

选择结构switch中break只能跳出当前结构，无法跳出外部循环结构

2

【深度强化学习】6. Q-Learning技巧及其改进方案

3

Golang学习笔记控制流

4

Strategic Game HDU - 1054（二分图匹配+最小点覆盖）

立即
投稿返回
顶部