我是靠谱客的博主 粗暴发夹,最近开发中收集的这篇文章主要介绍因果效应,典型模型及wasserstein距离, BNN,CFR,SITE,NetDeconfCFR_netwasserstein 距离参考,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

CFR_net

网络结构

在这里插入图片描述

目标函数

设计思想

L o s s = ϵ F + r e g _ L o s s + ϵ C F (1) Loss=epsilon_F+reg_Loss+epsilon_{CF}tag 1 Loss=ϵF+reg_Loss+ϵCF(1)
由如下推导可知其 I M P ( Φ ( x ) ) IMP(Phi(x)) IMP(Φ(x)) 决定了 counterfactual loss 的上界, 即 upper error bound.
在这里插入图片描述
于是, 可得整体的目标函数为:
在这里插入图片描述

balanced learning

由于混淆变量导致的样本分布不均是因果效应预估的重大挑战. 那么该任务的关键就是在特征的表示空间上学到一个均衡的分布.

wasserstein 距离

用于衡量两个分布之间的差异, 具体地, 它描述了由一个分布转变为另一个分布所需要的最小代价.

离散直观举例

该问题来源于 optimal transport 最优传输问题, 一个直观的例子见下.
有一批石子分布在n个发货地址, 需要运送到m个有需求的收货地址. 令运输代价=运输数量 * 运输距离.

  • 发货地址的石子分布为 p ( 1 ) , . . . , p ( n ) {p(1),...,p(n)} p(1),...,p(n); 收货地址的石子分布为 q ( 1 ) , . . . , q ( m ) {q(1), ..., q(m)} q(1),...,q(m), 总的供需平衡;
  • d i s t ( i , j ) dist(i,j) dist(i,j)表示两个地址之间的距离;
  • n u m ( i , j ) num(i,j) num(i,j) 表示某种运输方案T下, 从i地到j地运输的石子数量.
    那么该方案下的代价 为
    c o s t ( p , q , t ) = ∑ j m ∑ i n d i s t ( i , j ) × n u m ( i , j ) cost(p,q,t)=sum_j^m sum_i^n dist(i,j) times num(i,j) cost(p,q,t)=jmindist(i,j)×num(i,j).
    不同的方案有不同的代价, wasserstein 距离就是其中最小的代价.
    w a s s ( p , q ) = m i n ∑ j m ∑ i n d i s t ( i , j ) × n u m ( i , j ) wass(p,q)=min sum_j^m sum_i^n dist(i,j) times num(i,j) wass(p,q)=minjmindist(i,j)×num(i,j)

连续数学抽象

该定义来自参考[5]
Ω Omega Ω 是一个任意空间, D 是该空间的一个距离度量, μ ( x ) , ν ( x ) mu(x),nu(x) μ(x),ν(x)是点x在该空间的两个概率密度函数.
wasserstein distance定义为:
w a s s ( μ , ν ) = inf ⁡ π ∈ ∏ ( μ , ν ) ∫ Ω 2 D ( x , y ) d π ( μ , ν ) wass(mu,nu) =inf_{pi in prod(mu,nu)} int_{Omega^2} D(x,y) dpi(mu,nu) wass(μ,ν)=π(μ,ν)infΩ2D(x,y)dπ(μ,ν)
where ∏ ( μ , ν ) prod(mu,nu) (μ,ν) 是联合概率分布. 其两个边缘概率分布可表示为
∫ ν π ( μ , ν ) = μ int_nu pi(mu,nu)=mu νπ(μ,ν)=μ, ∫ μ π ( μ , ν ) = ν int_mu pi(mu,nu)=nu μπ(μ,ν)=ν.
符号 inf 为infimum, 表示下确界, 可简单理解为 min.

距离求解的代码实现

由 wasserstein 距离 的定义可知, 它不像向量距离这样是一个现成的闭式解表达式, 而是一个最优化问题. 求解涉及到 dual 对偶转换, 且有较大的计算复杂度.
在 python中, tensorflow 中怎么近似快速计算 wasserstein 距离, 参考[2,4]的附录代码中均给出了同样的实现, 它的实现又是来自参考[5].

与KL散度的关系

通常机器学习的多分类任务中会涉及到 交叉熵, 它等于KL散度减去一个固定的值. 但KL散度不满足距离的定义.

参考

  1. BNN, ICML2016
  2. CFR_net,ICML 2017, paper, code
  3. SITE,NeuralIPS 2018
  4. NetDeconf,WSDM2020, paper, code
  5. ICML2014,Fast Computation of Wasserstein Barycenters

最后

以上就是粗暴发夹为你收集整理的因果效应,典型模型及wasserstein距离, BNN,CFR,SITE,NetDeconfCFR_netwasserstein 距离参考的全部内容,希望文章能够帮你解决因果效应,典型模型及wasserstein距离, BNN,CFR,SITE,NetDeconfCFR_netwasserstein 距离参考所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(37)

评论列表共有 0 条评论

立即
投稿
返回
顶部