汤普森算法_基于上下文感知的汤普森采样推荐算法研究
基于上下文感知的汤普森采样推荐算法研究郑操【摘要】摘要:探索和利用是推荐系统中一类非常重要问题,如何在探索和利用中找到一个平衡点是这类问题的关键,通过物品的上下文信息以及通过对用户特征不断的学习,给出一个基于上下文感知的多臂Bandit模型,利用汤普森采样对用户特征进行迭代学习的算法,并通过累积回报评价指标对算法模型的有效性进行评估。【期刊名称】现代计算机(专业版)【年(卷),期】2019(000...