降维与度量学习KNN–k近邻学习降维MDS算法主成分分析PCA核化线性降维流形学习度量学习
KNN–k近邻学习KNN基于某种距离度量在训练集中找出与其距离最近的k个带有真实标记的训练样本,然后给基于这k个邻居的真实标记来进行预测分类任务:投票法或者加权投票法(基于距离远近,距离越近的样本权重越大)回归任务:平均法或者加权平均法(基于距离远近,距离越近的样本权重越大) KNN算法的核心在于k值的选取以及距离的度量。k值选取太小,模型很容易受到噪声数据的干扰,例如:极端地...