下面列举一些最常用的方法
1、根据阈值过滤掉方差小的变量。
2、通过计算变量与标签的相关系数,留下相关性高的特征。
3、根据决策树或者随机森林,选择重要程度高的特征。
4、利用PCA等算法,对数据进行变换,选择区分度最高的特征组合。
特征选择的方法,大部分在sklearn库中有对应的实现。
最后
以上就是勤劳大山最近收集整理的关于【数据挖掘 特征选择】特征选择常用方法的全部内容,更多相关【数据挖掘内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复