概述
初学机器学习,老是对假设高维度数据的分布近似满足高斯分布或者正态分布表示不解。维基百科中介绍的中心极限定律给予这个现象以合理的解释。以下公式和推理摘自维基百科中的推导。这三个定理分层次递进的介绍了,满足一定条件时,独立,但不同分布的随机变量序列的标准化和以标准正态分布为极限。所以现实生活中,很多数据都无独有偶的表现出了近似高斯分布的性质。因为现实世界里的很多事物都是通过大量独立不同分布的随机变量所展现的。
这些在斯坦福《机器学习》教程中,Andrew Ng也曾介绍过。所以有些以高斯分布为基础的分析模型,如高斯模型和高斯混合模型中都假设了数据满足高斯分布,这是合理的。
棣莫佛-拉普拉斯定理
棣莫佛-拉普拉斯(de Movire - Laplace)定理是中心极限定理的最初版本,讨论了服从 二项分布 的随机变量序列。它指出,参数为 n , p 的二项分布以 np 为均值、 np(1-p) 为方差的正态分布为极限。
林德伯格-列维定理
林德伯格 - 列维 (Lindeberg-Levy)定理,是棣莫佛-拉普拉斯定理的扩展,讨论独立同分布随机变量序列的中心极限定理。它表明,独立同分布、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限。
林德伯格-费勒定理
林德伯格-费勒定理,是中心极限定理的高级形式,是对林德伯格-列维定理的扩展,讨论独立,但 不同分布 的情况下的随机变量和。它表明,满足一定条件时,独立,但不同分布的随机变量序列的标准化和依然以标准正态分布为极限。
最后
以上就是称心烧鹅为你收集整理的假设高维度数据满足高斯分布的合理性的全部内容,希望文章能够帮你解决假设高维度数据满足高斯分布的合理性所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复