论文理解【RL经典】—— 【SQL】Reinforcement Learning with Deep Energy-Based Policies1. 思想2. 本文方法3. 实验4. 总结
标题:Reinforcement Learning with Deep Energy-Based Policies;发表:ICML 2017;领域:强化学习经典(Model-free + 最大熵思想),这篇是 SAC 的前身