标致小霸王

文章
6
资源
0
加入时间
2年10月24天

蒙卡罗树搜索(MCTS)——关于对UCB的理解蒙卡罗树搜索(MCTS)——关于对UCB的理解对于UCB的几项疑惑1. 探索2. 利用3. 矛盾点4. 根据公式理解平衡原理5.注意

蒙卡罗树搜索(MCTS)——关于对UCB的理解UCB即上限置信区间对于UCB的几项疑惑上节我们提到UCB可以平衡UCT算法的利用和探索。但是对于初学者小编来说,首先提出以下几项不成熟的疑惑:虽然说过广搜探索,深搜利用,但是他们各自的工作任务具体是什么?为什么在蒙卡罗树这里强调要平衡探索和利用?平衡是如何实现的?根据上述的几个问题,小编续接蒙卡罗树搜索对UCB展开了学习。1. 探索1)工作任务在蒙卡罗树搜索(MCTS)的过程中随机选择不同的节点,根据每个节点得到的更精确的汇报概率估计

Codeup100000621问题 D: 最短路径

题目描述:有n个城市m条道路(n<1000, m<10000),每条道路有个长度,请找到从起点s到终点t的最短距离和经过的城市名。输入:输入包含多组测试数据。每组第一行输入四个数,分别为n,m,s,t。接下来m行,每行三个数,分别为两个城市名和距离。输出:每组输出占两行。第一行输出起点到终点的最短距离。第二行输出最短路径上经过的城市名,如果有多条最短路径,输出字典序最小的那条。若不存在从起点到终点的路径,则输出“can’t arrive”。样例输入:3 3 1 31