关联分析通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则,它是从大量数据中发现多种数据之间关系的一种方法。另外,它也可以基于时间序列对多种数据间的关系进行挖掘。
关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式:
-
频繁项集(frequent item sets)是指经常出现在一块的物品的集合。
-
关联规则(associational rules)是暗示两种物品之间可能存在很强的关系
关联规则
- 从大量的数据中(购物小票)找到经常在一起出现的物品组合。
- 支持度 物品/物品组合 在所有数据中出现的频率
- 置信度 在物品A出现的前提下,有物品A和物品B同时出现的组合 概率情况 {a,b}同时出现的概率/{a}单独出现的概率
最小支持度:它表示了一组物品集在统计意义上需要满足的最低程度
最小可信度:它反映了关联规则的最低可靠程度
同时满足最小可信度阈值和最小支持度阈值的关联规则被称为强关联规则。比如啤酒与尿布。
频繁规则和有效规则
-
频繁规则:指的是关联结果中支持度和置信度都比较高的规则,
-
有效规则指的是关联规则真正能促进规则中的前/后项的提升
-
在做关联结果分析时,频繁规则往往会被“想当然”地认为是有效规则,但实际情况却并总是如此。
提升度:
应用关联规则和不应用产生结果的比例。提升都>1的才是有效的关联规则。
关联规则的应用场景
-
相同维度下的关联分析(关联分析的前后项是相同逻辑的内容维度)
-
网站页面浏览关联分析
-
可以帮助我们找到用户在不同页面(包含广告页、活动页、超市页、单品页、帮助页等)之间的频繁访问关系,以分析用户特定的页面浏览模式。
-
可用于了解不同页面之间的分流和引流关系
-
可以用来做不同页面间的页面浏览推荐,利于提高用户网站体验和转化率。
-
-
广告流量关联分析
-
针对站外广告投放渠道用户浏览或点击的行为分析,该分析主要用于了解用户的浏览和点击广告的模式,例如点击了A广告之后又点击了B广告;浏览了C广告之后又浏览了D广告
-
这种站外广告曝光和点击的关联分析可以为广告的精准投放提供参考。
-
可以用于网站引流的分析,假如公司通过一组整合传播媒体做活动宣传,那么我们可以分析用户通过宣传渠道到达网站的先后关系和频繁模式,可以从中发觉类似于用户从M广告到达网站之后,还会从N媒体点击到达网站,这对于广告媒体的投放组合和整合营销评估具有重要意义。
-
-
用户关键字搜索关联分析
-
分析用户在站内的搜索关键字是发现用户搜索兴趣并了解用户真实需求的方法之一。通过对用户搜索关键字的关联分析,可以得到类似于搜索了苹果之后又搜索了iPhone,搜索了三星之后又搜索了HTC,这种关联模型可用于搜索推荐、搜索联想等场景,有助于改善搜索体验,提高客户的目标转化率。
-
-
-
跨维度的关联分析
-
不同场景下的关联分析 发生的事件处于不同的时间下,但通常都在一个约束时间范围内(例如session,会话)。这种模式可以广泛用于分析运营中关注的要素
-
例如用户浏览商品与购买商品的关联分析、关注产品价格与购买商品价格的关联分析、用户加入购物车与提交订单的关联分析等
-
通过这种跨事件的关联分析,可以找到用户不同行为模式之间的关系,尤其可以发掘用户的真实需求和关注(潜在)需求之间的关联和差异性。这些信息可用于针对当前用户行为的个性化推荐,并对后续促销活动的价格策略的制定有参考价值。
-
-
相同场景下的事件关联
-
用户在同一个页面中点击不同功能、选择不同的应用等
-
这类信息可以帮助我们了解用户对于功能应用的先后顺序,有利于做产品优化和用户体验提升;对于不同产品功能组合、开发和升级有了更加明确的参考方向,便于针对用户习惯性操作模式做功能迭代
-
针对用户频繁查看和点击的内容,可以采用打包、组合、轮转等策略,帮助客户尽量缩小内容查找空间和时间,也能提升内容曝光度和用户体验度。
-
-
-
负相关,支持度和置信度高而提升度低的强规则使用
-
在商品销售策略中,不将具有互斥性的商品放到同一个组合购买计划中。
-
在站外广告媒体的投放中,不将具有互斥性的多个广告媒体做整合传播或媒体投放。
-
在关键字提示信息中,不将具有互斥性的关键字提示给客户。
-
在页面推荐的信息流中,不将具有互斥性的信息流展示给用户。
-
-
关联规则使用的逆向思维
-
常见的关联规则基于两种模式产生:
-
基于同一个时间内发生的事件:购物篮分,使用订单ID获取要分析的item数据
-
基于不同时间下发生的事件,但是可以通过特定的主键信息关联:用户在不同日期购买了多件商品,使用用户ID获取要分析的item数据
-
-
是否一定要将这些关联项放到一起?
-
将前后项内容故意分离开,利用用户主动查找的时机来产生更多价值或完成特定转化目标
-
-
不放到一起的前提:
-
关联规则必须是强规则&效规则
-
发生关联的前后项之间需要有非常强的完成动机
-
不能过多降低用户体验
-
举例:在做大型促销活动时,需要用户完成多个步骤才能获得抄底价商品的购买资格
-
-
-
关联规则的序列模式(基于不同时间下发生的频繁规则)
-
于普通关联模式最大的区别:有时间间隔,且有先后顺序,如购买了冰箱的客户会在3个月内购买洗衣机。
-
这是一种预测性分析的模式,能够将事件发生的时间和对象提取出来,因此更加适合对基于时间下的数据化运营的应用需求。
-
常见使用场景
-
客户购买行为预测:基于用户上次的购买时间和商品信息,预测下次购物的时间和商品
-
Web访问模式预测:基于用户上次浏览页面的时间和页面信息,预测下次最可能浏览的页面
-
关键字搜索预测:基于用户上次搜索关键字的时间和关键字,预测下次最可能搜索哪些关键
-
-
最后
以上就是还单身睫毛最近收集整理的关于关联分析概念的全部内容,更多相关关联分析概念内容请搜索靠谱客的其他文章。
发表评论 取消回复