GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化

75 阅读 0 评论 50 点赞

我是靠谱客的博主粗暴身影，最近开发中收集的这篇文章主要介绍GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

一、简介

在GBDT的迭代中，假设我们前一轮迭代得到的强学习器是f_t-1(x)损失函数是L(y,f_t-1(x)) 我们本轮迭代的目标是学习到弱学习器h_t(x)，让本轮的损失L(t,f_t-1(x)+h_t(x))最小。

假如有个人30岁，我们首先用20岁去拟合，发现损失有10岁，这时我们用6岁去拟合剩下的损失，发现差距还有4岁，第三轮我们用3岁拟合剩下的差距，差距就只有一岁了。如果我们的迭代轮数还没有完，可以继续迭代下面，每一轮迭代，拟合的岁数误差都会减小。

也就是说我们要求的是高偏差，然后一步一步慢慢缩小这个偏差。

二、负梯度拟合

初始化若学习分类器是：

每一轮都有一个损失函数要去拟合，因为是偏差，所以找不到一个真实值来去拟合。因此提出了一种方法：用损失函数的负梯度来拟合本轮损失的近似值，进而拟合一个cart回归树。

第t轮的第i个样本的损失函数的负梯度表示为:

利用(x_i,r_ti)(i=1,2,...m),我们可以拟合一颗CART回归树，得到了第t颗回归树，其对应的叶节点区域Rtj,j=1,2,...,J。其中J为叶子节点的个数。

每个叶子节点里有多个样本，然后求出使损失函数最小时的输出值ct_j（类似于标签）：

这样我们就得到了本轮的决策树拟合函数如下：

本轮最终得到的强学习器的表达式如下：

三、GBDT常用损失函数

分类

指数损失函数：

对数损失函数：

回归

均方差；

绝对损失

四、GBDT的正则化

五、优缺点

GBDT主要的优点有：

1) 可以灵活处理各种类型的数据，包括连续值和离散值。

2) 在相对少的调参时间情况下，预测的准确率也可以比较高。这个是相对SVM来说的。

3）使用一些健壮的损失函数，对异常值的鲁棒性非常强。比如 Huber损失函数和Quantile损失函数。

GBDT的主要缺点有：

1)由于弱学习器之间存在依赖关系，难以并行训练数据。不过可以通过自采样的SGBT来达到部分并行。

转载于:https://www.cnblogs.com/pacino12134/p/11335864.html

最后

以上就是粗暴身影为你收集整理的GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化的全部内容，希望文章能够帮你解决GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错，欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：数据结构与算法
浏览次数：75 次浏览
发布日期：2023-11-16 02:40:04
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_o_14_f1_13_j_26_0.html

GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化

概述

一、简介

二、负梯度拟合

三、GBDT常用损失函数

分类

回归

四、GBDT的正则化

最后

评论列表共有 0 条评论

发表评论取消回复

GBDT算法一、简介二、负梯度拟合三、GBDT常用损失函数四、GBDT的正则化

概述

一、简介

二、负梯度拟合

三、GBDT常用损失函数

分类

回归

四、GBDT的正则化

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复