概述
6.4 系统聚类的性质及类的确定
(3)根据统计量确定
上一讲介绍了 R-square,这里再补充 3 个用于确定分类个数的统计量。半偏 R-square:
即 k+1 类的 R-square 减去 k 类的 R-square,其用于衡量 k 类与 k+1 类的 R-square 的增值 。如果半偏 R-square 比较大,说明 k+1 类的 R-square 更大,更合理,因此不应该合并为 k 类。伪 F 统计量:
因为比较像 F 分布的定义,所以称为“伪F”
Bk 是组间平方,我们希望 B_k 比较大,进而当伪 F 统计量的值比较大的时候,认为其效果良好。伪 t2 统计量:
评价将类 K 和类 L 合并的效果。这是半偏 R-square 的变形,同样地,当它比较大的时候,认为 k+1 类更好。
(4)根据谱系图
几个准则:各类重心之间的距离必须很大(各类差异性显著);
确定的类中,各类所包含的元素不要很多;
类的个数必须符合实用目的;
若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类。
例子-- 16 个地区的聚类
最后
以上就是俭朴书包为你收集整理的多元统计分析最短距离法_多元统计分析第10讲(聚类分析:动态聚类)的全部内容,希望文章能够帮你解决多元统计分析最短距离法_多元统计分析第10讲(聚类分析:动态聚类)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复