强化学习之Q-Learning
Q-learning是RL最基础的算法,于1989年由Watkins被提出来,与同样经典的SARSA算法非常类似。按木盏习惯,本文依旧不会大量堆公式,尽量以易理解的方式来表达Q-Learning。1. 查表操作“查表操作”这四个字足以概括Q-Learning的精髓。大家都知道强化学习的用处就是“做决策”,翻译成计算机科学语言就是:在当前的state下选择对应的action。这一步完全可以...