健忘保温杯

文章
3
资源
0
加入时间
2年10月21天

Machine Learning A-Z学习笔记15-置信区间算法Machine Learning A-Z学习笔记15-置信区间算法

Machine Learning A-Z学习笔记15-置信区间算法1.简单原理用多臂老虎机问题,也就是探讨如何用最少的代价得知哪一台老虎机的中奖率最高,作为置信区间算法(Upper Confidence Bound, UCB)的举例。这张图是五台老虎机的中奖概率分布,X轴代表奖金额度,Y轴代表中概率,所以我们可以知道第五台老虎机的报酬率最高。接下来要探讨如何用一个良好的策略,通过不断的"探索(exploration)",尽快找到拥有最佳中奖概率分布的老虎机,并且"利