强化学习(二):贪心策略(ε-greedy & UCB)强化学习(二):贪心策略(ε-greedy & UCB)
强化学习(二):贪心策略(ε-greedy & UCB)夏栀的博客——王嘉宁的个人网站 正式上线,欢迎访问和关注:http://www.wjn1996.cn 强化学习是当前人工智能比较火爆的研究内容,作为机器学习的一大分支,强化学习主要目标是让智能体学习如何在给定的一个环境状态下做出合适的决策。强化学习相关概念请点击:强化学习(一):概述 强化学习任务中有两个非常重要的概念—...