Upper Confidence Bound Apply to Tree,即ucb公式应用于蒙特卡洛搜索树前段时间用这个算法参加了计算机博弈比赛,写的很糙,以为要爆炸,没想到效果还不错。先简单介绍一下标题的几个名词,不了解的同学想闹明白的话自行查阅相关资料。蒙特卡洛算法理论基础是大数定律,多次数重复模拟的各种结果的概率接近于真实概率,模拟次数越多越接近。就像那个用多个随机点求圆的面积的方法。ucb公式ucb值可以理解为这条路的预期价值,价值由两个部分来组成。该节点的ucb值 = 对该节点模拟得
算法专栏
2024-09-18
43 点赞
0 评论
65 浏览