连续型特征离散化的原因分析
在机器学习中,看过挺多案例,很多人在处理数据的时候,经常把连续性特征离散化。那么,什么情况下才需要对连续数据离散化呢?一、什么是离散化?连续数据:身高,年龄,工资离散数据:矮,高;红,绿;好,坏……连续属性的离散化就是将连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数值代表落在每个子区间中的属性值。数据离散化是指将连续的数据进行分段,使其变为一段段离散化的区间。...