眯眯眼月饼

文章
4
资源
0
加入时间
3年0月9天

【深度强化学习】6. Q-Learning技巧及其改进方案

【DataWhale打卡】第四次任务,主要是重新学习一下李宏毅的Q-learning部分的知识,推导很多。之前看的时候就是简单过了一遍,很多细节没有清楚。这篇笔记包括了李宏毅深度强化学习三个视频长度的内容。文章目录1. 概念/解释2. Value Function3. State-Action Value Function4. TIP: Target Network5. TIP: Exploration6. TIP: Experience Replay7. DQN7.1. Double DQN