强化学习-->Deep Reinforcement Learning
因为逐渐有人将强化学习应用到NLPNLP 的任务上,有必要了解一些强化学习基础知识,本篇博文总结自台大教授李宏毅关于深度学习的公开课内容。我们可以以上图来理解强化学习过程,我们机器人agentagent 通过observationobservation 了解到环境的 StateState,采取一些ActionAction ,并且改变当前的环境,然后环境会反馈正向或负向的rewardreward 给a