Meta Reinforcement LearningOn the Origin of Meta-RLDefine Meta-RLMeta-Learning Algorithms for Meta-RLTraining Task AcquisitionReferences
转自Meta Reinforcement LearningMeta-RL是针对强化学习任务的元学习。在对任务分布进行训练后,agent能够通过开发一种新的具有内部活动动态的RL算法解决新任务。这篇文章从meta-RL的起源开始,然后深入研究meta-RL的三个关键组成部分。在之前关于元学习的文章中,这个问题主要是在 few-shot 分类的背景下定义的。在这里,我想探讨更多的案例,当我们试图通过开发一个 agent 来“元学习”强化学习(RL)任务,可以快速有效地解决看不见的任务。