过时石头

文章
5
资源
0
加入时间
2年10月21天

Pytorch与强化学习 —— 1. 如何实现一个简单的Q Learning算法1. 什么是强化学习(Reinforcement Learning)2. 最简单的强化学习算法——Q Learning3. 代码实现

文章目录1. 什么是强化学习(Reinforcement Learning)1.1. 我们从一个小游戏开始1.2. 先从理解游戏规则开始2. 最简单的强化学习算法——Q Learning2.1. 奖励函数2.2. 最佳未来估计策略2.3. 游戏过程3. 代码实现3.1. Q Table3.2. Rule Table3.3. 计算期望3.3. 环境交互3.4. 完整的模型3.5. 运行结果1. 什么是强化学习(Reinforcement Learning)1.1. 我们从一个小游戏开始如果你是第一