EM算法理论总结

84 阅读 0 评论 56 点赞

我是靠谱客的博主碧蓝店员，最近开发中收集的这篇文章主要介绍EM算法理论总结，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

主要解决具有隐变量的混合模型的参数估计

在高斯模型中，每个聚类都服从某个概率分布，我们要做的就是利用EM算法确定这些分布的参数，对高斯模型来说就是计算均值和方差，对多项式模型那就是概率

个人的理解就是用含有隐变量的含参表达式不断拟合，最终能收敛并拟合出不含隐变量的含参表达式

假如有人告诉你，那一个点属于哪一个模型，你当然能够估计出这些分布的均值和方差。但实际上这些都是未知的，相反假如你已经知道均值和方差，那么你也能推断出哪一点属于哪一个模型，但是均值和方差同样也是未知的，所以你需要用均值和方差来判断从属关系或是用从属关系估计出均值和方差，这就是EM算法的基本原理。EM算法开始执行时，各个高斯模型会被随机分配到N维空间中，就像K-means算法，均值和方差都是随机的，然后根据当前的均值和方差，判断某点X有多大可能性来自蓝色或者黄色模型，然后将这个点分配到蓝色和黄色模型，但不同于K-means算法的是这个分配不是硬性的，K-means要么将这个点分给蓝色要么分给黄色。EM算法将这个点属于蓝色或黄色的概率计算出来，但它不会把概率置0或者1，这个概率属于(0,1)，这就是叫它柔性聚类法的原因，它不会直接把某点分配给某个模型，而是告诉我们这个点属于某个模型的概率，然后利用概率来重新估计各个模型的均值和方差，进而改进之前的概率，这就是EM像K-means的原因，但概率又使它们区别开来，就像K-means算法那样，我们讲上面的过程迭代直至收敛。

模型的EM训练过程
直观的来讲是这样：我们通过观察采样的概率值和模型概率值的接近程度，来判断一个模型是否拟合良好。然后我们通过调整模型以让新模型更适配采样的概率值。反复迭代这个过程很多次，直到两个概率值非常接近时，我们停止更新并完成模型训练。现在我们要将这个过程用算法来实现，所使用的方法是模型生成的数据来决定似然值，即通过模型来计算数据的期望值。通过更新参数μ和σ来让期望值最大化。这个过程可以不断迭代直到两次迭代中生成的参数变化非常小为止。该过程和k-means的算法训练过程很相似（k-means不断更新类中心来让结果最大化），只不过在这里的高斯模型中，我们需要同时更新两个参数：分布的均值和标准差.

极大似然估计(MLE)