我是靠谱客的博主 认真睫毛,最近开发中收集的这篇文章主要介绍论文阅读笔记:Item-based collaborative filtering recommendation algorithms,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

文章目录

    • Item-based collaborative filtering recommendation algorithms
    • 研究现状
    • UserCF存在挑战
    • 研究思路
    • 相关工作
    • 研究步骤
      • 1.计算物品相似度
      • 2.计算用户u对物品i的评分
    • 实验
      • 实验步骤
      • 实验结果
    • 结论

Item-based collaborative filtering recommendation algorithms

ACM 2001 Article, 2001
在这里插入图片描述
在这里插入图片描述

研究现状

  • 基于用户(k近邻)的协同过滤推荐系统,正取得广泛的成功[19,27,14,16]。

UserCF存在挑战

  1. scalarity: improve the scalability of the collaborative filtering algorithms(提高可扩展性)
  2. sparity: improve the quality of recommendations for users(提高推荐质量)
  • 信息量的增长和用户数量的增长会大大增加传统协同过滤系统的计算量,需要新的推荐技术为数百万用户和物品在短时间内提供高质量的推荐,同时提高面对稀疏性数据的覆盖率。

研究思路

  • 传统CF算法的瓶颈在于为百万用户搜索可能的邻居[12],基于物品的算法通过首先探索物品而不是用户间的关系避免了这个瓶颈。
  • 为用户推荐用户喜欢的物品相似的物品。由于物品之间的关系相对固定,相比基于用户的算法在提供相同质量的推荐时需要更少的在线计算。

相关工作

  • CF-based[10,19,16,27,14,20]
  • Bayesian network[6]
  • clustering[2,6,29]
  • graph-based[1]
  • rule-based[25]
  • sparity[23,11,4,24]

  • 探索了基于物品的协同过滤算法。基于物品的协同过滤算法首先分析user-item矩阵来确定不同items之间的关系(相似度),然后利用物品之间的关系间接为用户计算推荐物品。

研究步骤

1.计算物品相似度

分析了不同的基于物品的推荐生成算法。计算物品相似度的不同方法;从物品相似度获得推荐的不同方法。

  1. cosine similarity
    在这里插入图片描述
  2. pearson correlation-based similarity
    在这里插入图片描述
  3. adjusted cosine similarity
    在这里插入图片描述

2.计算用户u对物品i的评分

  • 加权求和
    在这里插入图片描述

分母为所有和物品 i i i存在相似度 s ( i , j ) s(i,j) s(i,j)的物品数量,分子为用户 u u u对物品 j j j的评分和物品相似度 s ( i , j ) s(i,j) s(i,j)的加权求和。

  • 基于线性回归
    在这里插入图片描述
    评估实验结果,并和基本的k近邻方法进行了比较。

实验

  • 数据集:最小的movielens数据集(超过43000用户对3500+电影的100000评分数据)
  • 评估指标:MAE

实验步骤

  1. 划分训练集和测试集,在训练集上10折交叉验证寻找超参数
  2. 将user-based CF作为benchmark

实验结果

  1. 物品相似度
    在这里插入图片描述
  2. 训练集/测试集:0.8
  3. K:30
    在这里插入图片描述
  4. Item-based vs. User-based CF
    在这里插入图片描述
    (1)在稀疏数据集上Item-based优于user-based CF
    (2)regression-based在特别稀疏的数据集上表现更好,随着数据的增多性能会下降(过拟合?)
  5. item-based CF不同k的影响
    在这里插入图片描述
    the high accuracy that can be achieved using only a fraction of items.
  6. 不同model size和train/test ratio的run-time( time required to generate
    predictions for the entire test set )和through-put(predictions generated per second)
    在这里插入图片描述

结论

item-based techniques hold the promise of allowing CF-based algorithms to scale to large data sets and at the same time produce high-quality recommendations.
基于物品的算法比基于用户的算法有更好的性能,同时提供了比基于用户的最佳算法更好的质量。

最后

以上就是认真睫毛为你收集整理的论文阅读笔记:Item-based collaborative filtering recommendation algorithms的全部内容,希望文章能够帮你解决论文阅读笔记:Item-based collaborative filtering recommendation algorithms所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(49)

评论列表共有 0 条评论

立即
投稿
返回
顶部