https://blog.csdn.net/blmoistawinde/article/details/84329103
背景很多场景需要考虑数据分布的相似度/距离:比如确定一个正态分布是否能够很好的描述一个群体的身高(正态分布生成的样本分布应当与实际的抽样分布接近),或者一个分类算法是否能够很好地区分样本的特征(在两个分类下的数据分布的差异应当比较大)。(例子:上图来自 OpenAI的 Radford A , Jozefowicz R , Sutskever I . Learning ...