我是靠谱客的博主 朴素微笑,最近开发中收集的这篇文章主要介绍Apriori算法简介,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

本博客不再更新,更多精彩内容请访问我的独立博客

Apriori算法
Apriori算法步骤:

1.Apriori算法:使用候选项集找频繁项集
2.由频繁项集产生关联规则

例:设A=足球服,B=足球鞋, C=足球。某网上商城的销售情况如下:

客户号

客户

商品

数量

C1

李鸣

足球服A

10

C1

李鸣

足球鞋B

8

C1

李鸣

足球C

60

C2

金珊

足球C

20

C3

冯君

足球服A

50

C3

冯君

足球鞋B

60

C4

丁贝

足球鞋B

20

C5

陈骋

足球服A

30

不关心商品的销量,只关心商品间的关联度

基本概念
支持度 :    设W 中有s %的事务同时支持物品集A 和B,s %称为关联规则A→B 的支持度。
   例如:A的支持度=60%          A→B 的支持度 = 40%

  Apriori算法:找频繁项集:
1、在第一轮循环中,所有1项目(只有1项)集是候选项目集,从中筛选出
支持度>最小支持度的项目放入频繁项目集
2、在第二轮循环中,只有频繁1项目组成的2项目才是候选项目,从中筛选出
支持度>最小支持度的2项目放入频繁项目集。
3、继续循环,直至n轮循环,所有的频繁项目选出,频繁项目集形成。

设最小支持度为30%
(1)1项目候选项:A 、     B  、 C
                   
  支持度: 60%       60%       40%
          所以频繁项目集:    进入下一轮单项:
          {A 、B、C}                {A 、B、C}
22项目候选项:AB 、BC、AC
                   
      支持度:40%   20%   20%
          所以频繁项目集:        进入下一轮单项:
          {A 、B、C、AB}         {A, B}
(3)3项目候选项:无
         
算法终止
所以频繁项目集:
         
{A 、B、C、AB}
由频繁项集产生关联规则

频繁项目

支持度

频繁项目

支持度

A

60%

C

40%

B

60%

AB

40


可信度:它是针对规则而言的。指在出现了物品集A 的事务T 中,物品集B 也同时出现的概率有多大。
       可信度=p(condition and result)/p(condition)
兴趣度:物品集A 的出现对物品集B 的出现有多大的影响。 
兴趣度=p(condition and result)/p(condition)*p(result)。
——当兴趣度大于1的时候,这条规则就是比较好的;
——当兴趣度小于1的时候,这条规则就是没有很大意义的。
例: 规则1:if  A   THEN  B , 可信度?
可信度= (A和B)/ A = 40% / 60% = 67% 
规则2:if  A   THEN  C , 可信度?
可信度= (A和C)/ A = 20% / 60% = 33%

规则3:if  A   THEN  B , 兴趣度?
兴趣度=  (A和B)/  (A*B) =  40% / (60% * 60%)= 1.11 > 1  有意义

规则4:if  A   THEN  C , 兴趣度?
兴趣度=  (A和C)/  (A*C) =  20% / (60% * 40%)= 0.83 < 1



最后

以上就是朴素微笑为你收集整理的Apriori算法简介的全部内容,希望文章能够帮你解决Apriori算法简介所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(43)

评论列表共有 0 条评论

立即
投稿
返回
顶部