犹豫战斗机

文章
7
资源
0
加入时间
3年0月28天

什么是 Deep Deterministic Policy Gradient (DDPG)

什么是 Deep Deterministic Policy Gradient (DDPG)DDPG 最大的优势就是能够在连续动作上更有效地学习.将DDPG进行拆分:如上图所示,我们将 DDPG 分成 ‘Deep’ 和 ‘Deterministic Policy Gradient’, 然后 ‘Deterministic Policy Gradient’ 又能被细分为 ‘Deterministi...