聚类基本概念及常见聚类算法和EM算法1. 基本概念2. 常见聚类算法
聚类:发现数据中分组聚集的结构,根据数据中样本与样本之间的距离或相似度,依据类内样本距离小(相似度大)、类间样本距离大(相似度小)将样本划分为若干组/类/簇。簇集合的其他区别簇的类型距离度量函数应满足条件:非负性:dist(xi,yj)≥0dist(x_i,y_j)\ge0dist(xi,yj)≥0不可分的同一性:dist(xi,yj)=0ifxi=xjdist(x_i,y_j)=0\quad if\quad x_i=x_jdist(xi,yj)=0ifxi=xj对称性:dist(x