对贝叶斯平滑的理解

227 阅读 0 评论 150 点赞

我是靠谱客的博主任性发卡，这篇文章主要介绍对贝叶斯平滑的理解，现在分享给大家，希望可以做个参考。

对贝叶斯平滑的理解

假设现在要对每个广告求历史ctr(求贝叶斯平滑后的值)。

贝叶斯平滑就是对广告的CTR进行贝叶斯估计（最小化损失函数在后验分布上的期望）。

N个广告，其点击信息和曝光信息分别是 $C_1, C_2, ..., C_i, ..., C_N), (I_1, I_2, ..., I_i, ..., I_N)$ 。
每个广告都有一个隐含的CTR值 $r_1, r_2, ..., r_i, ..., r_N)$ 。这些隐含的CTR值服从 $B e t a (α, β)$ 【先验】。
每个广告的点击信息都是服从二项分布 $Binomial(I_i, r_i)$ 【似然】。
二项分布和Beta分布是共轭的，所以广告CTR的后验分布也是Beta分布，记为 $Beta(alpha^{'}, beta^{'})$ 。
当使用平方损失函数 $L(hat{r_i}, r_i) = (hat{r_i} - r_i)^2$ 时，贝叶斯估计值就是后验分布的期望值。所以可以求出第 $i$ 个广告的ctr的贝叶斯估计值为 $hat{r_i} = frac{C_i + alpha}{I_i + alpha + beta}$ 。这就是贝叶斯平滑后的值。
也就是说，将先验分布中的参数 $α, β$ 求出来，就得到了贝叶斯平滑中的平滑因子。
可以使用矩估计法来求参数 $α 、 β$ ，
- Beta分布的期望： $E ( X ) = α α + β E(X)=frac{alpha}{alpha+beta}$ ；用样本均值 $\overline{X}$ 来代替期望
- Beta分布的方差： $beta}{(alpha+beta)^{2}+(alpha+beta+1)}$ ；用样本方差 $S^2$ 来近似代替方差
- 可以求得： $alpha=overline{X}left(frac{overline{X}(1-overline{X})}{S^{2}}-1right)$
  
  $beta=(1-overline{X})left(frac{overline{X}(1-overline{X})}{S^{2}}-1right)$

最后

以上就是任性发卡最近收集整理的关于对贝叶斯平滑的理解的全部内容，更多相关对贝叶斯平滑内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(150)

本文分类：推荐系统
浏览次数：227 次浏览
发布日期：2024-08-24 18:55:02
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_7_o_14_fz_14_z_6_y.html

相关文章

门结构简介

SENET和GateNet（推荐系统（embedding)）SENET介绍GateNet

SENET和GateNet（推荐系统（embedding)）SENET介绍GateNet

深度学习计算模型中“门函数（Gating Function）”的作用

深度学习计算模型中“门函数（Gating Function）”的作用

一文看懂 Bahdanau 和 Luong 两种 Attention 机制的区别

一文看懂 Bahdanau 和 Luong 两种 Attention 机制的区别

对贝叶斯平滑的理解

CTR的贝叶斯平滑

一文看懂推荐系统：Gate网络（一）：新浪微博GateNet，GateNet就是想用attention的方法去搞，和SENet一样，都是张俊林的杰作一文看懂推荐系统：Gate网络（一）：新浪微博GateNet，GateNet就是想用attention的方法去搞，和SENet一样，都是张俊林的杰作前言一、GateNet网络类型二、GateNet论文实验结论三、自己实践中一些结论总结

一文看懂推荐系统：Gate网络（一）：新浪微博GateNet，GateNet就是想用attention的方法去搞，和SENet一样，都是张俊林的杰作一文看懂推荐系统：Gate网络（一）：新浪微博GateNet，GateNet就是想用attention的方法去搞，和SENet一样，都是张俊林的杰作前言一、GateNet网络类型二、GateNet论文实验结论三、自己实践中一些结论总结

贝叶斯平滑

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部