q learning 参数_深度强化学习之深度Q网络DQN详解
引言本文将对深度强化学习中经典算法DQN进行详细介绍,先分别介绍强化学习和Q-学习,然后再引入深度强化学习和DQN。本文所有参考资料及部分插图来源均列在文末,在文中不做额外说明。强化学习讲强化学习先讲其适用的场景。强化学习多用在需要与环境交互的场景下,即给定一个环境的状态(State),程序根据某种策略(Policy)选出一个对应的行为(Action),而执行这个Action后环境又会发生改变,即...