对The Curse of Dimensionality(维度灾难)的理解
一个特性:低维(特征少)转向高维的过程中,样本会变的稀疏(可以有两种理解方式:1.样本数目不变,样本彼此之间距离增大。2.样本密度不变,所需的样本数目指数倍增长)。高维度带来的影响:1.变得可分。 由于变得稀疏,之前低维不可分的,在合适的高维度下可以找到一个可分的超平面。2.过拟合风险。 过高维度会带来过拟合的风险(会学习到数据集中的特例或异常,对现实测试数据效果较差)。...