每天五分钟机器学习:使用降维算法可以完成高维数据的压缩表示本文重点降维
前面我们学习了第一种无监督学习算法k-means,本章我们将学习另外一种无监督算法,称为降维算法。降维可以数据压缩,因而使用较少的计算机内存空间,也加快学习算法的运行。现在有一个数据集,这个数据集中每个样本有多个特征,为了能够可视化,我们只显示其中的两个特征,一个特征是x1表示物体的长度,单位是厘米,另外一个特征x2也表示物体的长度,单位是英寸,那么我们可以认为特征x1和特征x2表示的是一个意思,所以这是一个非常冗余的数据,所以这两个特征我们应该只保留一个即可。 保留一个特征,这个需要降维,那么