机器学习 集成学习各算法-gbdt,xgboost,lightgbm比较及优缺点特征总结处理高维稀疏特征的时候LR效果比GBDT好?
随机森林优点具有极高的准确率 随机性的引入,使得随机森林不容易过拟合,有很好的抗噪声能力,对异常点离群点不敏感 能处理很高维度的数据,并且不用做特征选择 既能处理离散型数据,也能处理连续型数据,数据集无需规范化(归一化) 实现简单,训练速度快,可以得到变量重要性排序(计算每个特征在分裂时被选到的次数或者某个特征不纯度平均下降了多少) 容易实现并行化 在创建随机森林的时候,对gen...