我是靠谱客的博主 潇洒黑裤,最近开发中收集的这篇文章主要介绍IJCAI2019|新型特征增广GBDT--AugBoost(已开源),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

AugBoost: Gradient Boosting Enhanced with Step-Wise Feature Augmentation

Philip Tannor, Lior Rokach

Tel-Aviv University, Ben-Gurion University of the Negev

https://www.ijcai.org/proceedings/2019/0493.pdf

GBDT是一种广泛应用的机器学习算法,在很多任务中都取得了SOTA结果。

这篇文章针对GBDT提出一种特征增广的方法,并且取得了较好的效果。对多种特征增广方法进行了探索,利用神经网络的最后一个隐含层来提取特征,该方法是有监督的;或者利用无监督方法,如PCA或者随机映射将特征空间进行旋转。

作者将这几种方法在20个分类数据集上进行测试,结果优于GBDT及之前的相关方法。

本文主要探索如何针对GBDT进行有监督的特征增广,先前已有针对RF如何进行无监督特征增广。

640?wx_fmt=png

本文主要贡献如下,提出了AugBoost-ANN, AugBoost-PCA, AugBoost-RP。

640?wx_fmt=png

GBDT数学表述如下

640?wx_fmt=png

基于梯度的表示方式如下

640?wx_fmt=png

贪婪式二阶段解释如下

640?wx_fmt=png

更进一步的,一些参数计算及更新方式如下

640?wx_fmt=png

基于ANN进行特征增广的训练流程示意图如下

640?wx_fmt=png

基于AugBoost-ANN的推理过程图示如下

640?wx_fmt=png

利用PCA进行特征增广的方法描述如下

640?wx_fmt=png

基于RP进行特征增广方法跟PCA的类似,不再赘述。

这两种方法跟基于ANN的方法区别如下

640?wx_fmt=png

一些实现细节描述如下

640?wx_fmt=png

实验中的一些细节和设置如下

640?wx_fmt=png

关于如何使用PCA,一些细节如下

640?wx_fmt=png

树的个数及增广细节如下,这里的BA为Between Augmentations

640?wx_fmt=png

下面是训练算法伪代码

640?wx_fmt=png

关于上述伪代码,一些需要注意的点如下

640?wx_fmt=png

在多个数据集上多种方法的实验结果对比如下

640?wx_fmt=png

在学习曲线及泛化性能方面的实验结果如下

640?wx_fmt=png

对应的图示如下

640?wx_fmt=png

一些假设检验的结果如下

640?wx_fmt=png

n_BA的影响很大,不同的取值影响如下

640?wx_fmt=png

一些结论如下,如降维不会提升结果,利用RP升维可能会明显降低准确率。640?wx_fmt=png

代码地址

https://github.com/ptannor/augboost


              smiley_12.png我是分割线smiley_12.png


您可能感兴趣

最后

以上就是潇洒黑裤为你收集整理的IJCAI2019|新型特征增广GBDT--AugBoost(已开源)的全部内容,希望文章能够帮你解决IJCAI2019|新型特征增广GBDT--AugBoost(已开源)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(31)

评论列表共有 0 条评论

立即
投稿
返回
顶部