蒙卡罗树搜索(MCTS)——关于对UCB的理解蒙卡罗树搜索(MCTS)——关于对UCB的理解对于UCB的几项疑惑1. 探索2. 利用3. 矛盾点4. 根据公式理解平衡原理5.注意
蒙卡罗树搜索(MCTS)——关于对UCB的理解UCB即上限置信区间对于UCB的几项疑惑上节我们提到UCB可以平衡UCT算法的利用和探索。但是对于初学者小编来说,首先提出以下几项不成熟的疑惑:虽然说过广搜探索,深搜利用,但是他们各自的工作任务具体是什么?为什么在蒙卡罗树这里强调要平衡探索和利用?平衡是如何实现的?根据上述的几个问题,小编续接蒙卡罗树搜索对UCB展开了学习。1. 探索1)工作任务在蒙卡罗树搜索(MCTS)的过程中随机选择不同的节点,根据每个节点得到的更精确的汇报概率估计