机器学习系列文章——特征的处理与选择(归一化、标准化、降维、PCA)
一、特征处理特征处理是通过特定的统计方法,将数据转化成算法要求的数据。其API为sklearn.preprocessing。先来看一组数据:第一组中的特征1 相比于特征2而言大了几十倍,在正常处理时这些点即可视为异常点,影响统计结果分析。采用特征处理后转变为右侧的数据,可以更加方便的处理而不会产生异常值。常见的处理方法如下:数据类型处理方法数值型数据归一化、标准化、缺失值类别型数据one hot编码时间型数据时间的切分( 一)归一化归一化是通过对原始数