推荐系列论文八-ESMM-完整空间下的多任务学习

93 阅读 0 评论 62 点赞

我是靠谱客的博主传统烧鹅，最近开发中收集的这篇文章主要介绍推荐系列论文八-ESMM-完整空间下的多任务学习，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

ESMM-Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate

论文地址

前言

这次带来阿里妈妈团队于18年发表在SIGIR的一篇多任务学习的文章，主要基于多任务学习的思想对CVR问题进行优化预估。

背景

首先说一下广告收费的形式，包括多种：

cpt的广告
- 按照展示时间收费，典型如视频前的广告，这部分只要放出去就给钱，有点类似电视广告
cpm
- 按照广告展示次数收费
cpc
- 按照点击来收费，也就是典型的ctr场景
cpv
- 按转化来收费，例如用户必须下载了app、必须买了商品才付费
等等…

那么我们分析一下平台和广告主的心理，平台最希望的是哪种形式呢？cpt、cpm这种，投放了就收费。

广告主则最喜欢的是cpv的广告，光展示没有转化对于广告主而言就是没有钱进口袋的。

ctr预估的论文已经比较多了，而针对cvr即转化率预估的相对更少，通常的做法其实和点击率预估一样，但是在样本选择时存在一定的不同，区别点主要在以下：

用户的行为序列是这样的：曝光->点击->转化，也就是说一定是先点击再产生转化。
cvr预估的前提是已经产生了点击，即预估的是点击后再产生转化的概率，正样本是既点击又转化的样本，负样本是点击了却没有转化的样本，大致的关系图如下：

在这里插入图片描述

那么cvr预估就存在这样的一个问题，使用仅点击后的样本训练，而实际应用却是使用所有的样本，文章中称之为样本选择偏差smple selection bias (SSB)，并且只是用点击样本训练还会使得很稀疏，因为用户点击本就不是一个经常发生的事件。

总结一下，存在的问题是以下两个：

样本选择偏差，cvr预估训练以及实际场景的数据不同
数据稀疏问题

这里想一下cvr任务可以使用全部曝光样本训练么？这就牵扯到业务形态的问题了，一般想当然来说用户愿意点当然更愿意转化啊，但是我自己实际的体验中不一定是这样，我一个朋友就遇到这么一个场景(请不要问我这个朋友是不是我):

首先看到推广的商品，封面是漂亮小姐姐，小姐姐很漂亮那么我点进去看一看=>我仅仅是进去看一看，我并不会买女装，所以你继续推漂亮的小姐姐给我，我还是会点击，但是我就是不会买。

从上面的场景可以看出来，点不点和素材内容关系很大，因为人是一个很靠感官判断的生物，但是具体需不需要那就又得另说了。

正文

前面说了这么多，其实就是引出两个问题，一个就是说cvr预估使用点击样本训练是没有问题的，第二个呢就是cvr预估只使用点击样本训练是有问题的。这两个问题看似很矛盾，但是居然可以通过ESMM解决，我第一次看这篇文章的时候其实有许多不理解的地方，直到自己在做ctr预估方面工作回看才觉得，这个真的有点东西，好，下面不啰嗦了。