灵巧大米

文章
8
资源
0
加入时间
3年1月10天

数据预处理的概念

数据的预处理通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题:不属于同一量纲: 即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。信息冗余: 对于某些定量特征,其包含的有效信息为区间划分,例如学习成绩,假若只关心“及格”或不“及格”,那么需要将定量的考分,转换成“1”和“0”表示及格和未及格。二值化可以解决这一问题。定性特征不能直接使用: 某些机器学习算法和...