特征筛选(1)——特征筛选Filter方法 【Kaggle】Telco Customer Churn 电信用户流失预测案例 Part 3.特征衍生与特征筛选
【Kaggle】Telco Customer Churn 电信用户流失预测案例第三部分导读 在案例的第二部分中,我们详细介绍了常用特征转化方法,其中有些是模型训练之必须,如自然数编码、独热编码,而有些方法则是以提高数据质量为核心、在大多数时候都是作为模型优化的备选方法,如连续变量分箱、数据标准化等。当然,在此之后,我们首先尝试构建一些可解释性较强的模型来进行用户流失预测,即采用逻辑回归和决策树模型来进行预测,并同时详细介绍了两种模型在实战中的调优技巧,在最终模型训练完成后,我们也重点讨论了关于