我是靠谱客的博主 真实小霸王,最近开发中收集的这篇文章主要介绍Xgboost如何处理缺失值,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Xgboost

Xgboost简介

Xgboost[1]是由陈天奇提出的一种集成学习方法,要想了解Xgboost,这里建议先了解决策树,再了解GBDT(Gradient boosting descent tree)即梯度提升树,再学习理解Xgboost。推荐学习方式,阅读[1]这篇论文,你将对Xgboost如何处理缺失值,以及模型复杂度控制有更加深刻的理解(注:对论文中正则化方式有疑问,可留言讨论)。

Xgboost缺失值处理

Xgboost如何处理缺失值呢,最简单直观的方式可以通过下面这个算法流程来表示。实际处理时,可以将缺失值设置成missing=-999或missing=-9999。


这里解释一下:这个算法流程图参考[1],是陈天奇在论文“XGBoost: A Scalable Tree Boosting System”中提出来的,通过自动学习,得出最优分裂方向。

在机器学习领域,也有很多其他缺失值处理的方式,这里大概列举一下,包括求均值,补0,插值的方法,one-hot编码等。


参考文献:

[1] T. Chen, C. Guestrin, "XGBoost: A Scalable Tree Boosting System" Acm Sigkdd International Conference on Knowledge Discovery & Data Mining, pp.785-794, 2016.点击打开链接

最后

以上就是真实小霸王为你收集整理的Xgboost如何处理缺失值的全部内容,希望文章能够帮你解决Xgboost如何处理缺失值所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(59)

评论列表共有 0 条评论

立即
投稿
返回
顶部