特征工程--有序类别变量&单数值变量特征工程有序类别特征
有序类别特征有序类别特征,故名思意,就是有相对顺序的类别特征。例如: 年龄段特征:"1-10,11-20,21-30,31-40"等年龄段; 评分特征:"high,medium,low"; 有序类别特征和无序的类别特征有些许区别,例如Label编码等,如果我们直接按照原先的LabelEncoder进行转化就会丢失特征相对大小的信息,这对于梯度提升树模型会带来负向的效果,因为序列信息可能和标签有着强烈的相关性,比如回购的问题,有“high,medium,