降维降维是解决维度灾难和过拟合的重要⽅法,除了直接的特征选择外,我们还可以采⽤算法的途径对特征进⾏筛选,线性的降维⽅法以 PCA 为代表,在 PCA 中,我们只要直接对数据矩阵进⾏中⼼化然后求奇异值分解或者对数据的协⽅差矩阵进⾏分解就可以得到其主要维度。⾮线性学习的⽅法如流形学习将投影⾯从平⾯改为超曲⾯。解决过拟合的问题除了正则化和添加数据之外,降维是最好的方法。降维的思路来源于维度灾难的问题,我们知道n维球的体积为:那么在球体积与边长为2R的超立方体比值为:这就是上面所说的降维灾难,在高维数据
机器学习
2024-06-08
34 点赞
0 评论
51 浏览