摘要
在定向展示广告中,目标是确定向最有可能采取购买产品或订阅时事通讯等行动的在线用户展示横幅广告的最佳机会。找到最好的广告投放,即向用户展示广告的机会,需要估计在浏览器上看到广告的用户将采取行动的概率,即用户将转换的概率。然而,转换概率估计是一项具有挑战性的任务,因为在不同的数据维中存在极端的数据稀疏性,并且很少发生转换事件。在本文中,我们提出了我们的方法来估计转化率,它依赖于过去的用户,发布者和广告客户数据层次的性能观察。更具体地说,我们在不同的选择层次上各自建立转换事件模型的二项分布并且独立的估计分布参数。然后,我们将演示如何使用逻辑回归结合这些单独的估计器来准确地识别转换事件。在我们的介绍中,我们还讨论了主要的实际考虑,如数据不平衡、缺失数据和输出概率校准,这使得估计问题更加困难,但仍需要解决的实际实现的方法。我们提供了真实的广告活动的结果来证明我们提出的方法的有效性。
INTRODUCTION
在在线展示广告世界中,广告主试图通过将他们的图形广告嵌入发布者网页的内容,例如新闻门户网站的页面,来向许多用户营销他们的产品。广告商的主要目标是在合适的环境下接触到最容易接受广告的网络受众,他们将参与他们展示的广告,并最终根据活动的类型采取所需的行动,例如,品牌广告或直接产品营销。实现这一目标的复杂性如此之高,以至于广告商需要一种被称为需求方平台(DSP)的专门技术解决方案。
在多个直接购买市场或广告交换平台上,通过实时拍卖或竞价,可以获得广告印象,dsp帮助为许多不同的广告主同时管理此类展示广告活动。在直接购买市场中,印象价格是根据发布者和广告主之间直接进行的商务谈判预先确定的。另一方面,在实时广告交换中,DSPs必须为每个展现提交出价(通过广告呼叫提交),展现在公开拍卖中卖给出价最高的人。DSPs是将所有关于用户、页面、广告和活动约束的信息汇集在一起为广告主做出最佳决策的平台(见2.1的概述)。
广告客户为每个广告呼叫寻求最优出价,以使他们的活动表现最大化。广告印象的最佳出价取决于印象对特定广告商的价值。这个值作为活动性能参数提供给dsp,形式为每次点击成本(CPC)或每次行动成本(CPA)目标。如果CPC或CPA的目标设置,那么可以确定最优投标价格的预期cost-per-impression,等于这个印象的点击通过率(CTR)乘以CPC的目标,或转化率(表格)乘以CPA目标[8]。
在这个场景中,性能直接取决于CTR或CVR的估计情况,而性能优化可以看作是准确估计CTR或CVR的问题。如果CTR或CVR被高估,投标价格将总是高于他们应该有的价格,广告商将浪费竞选预算在无用的印象;另一方面,如果这些数量被低估了,广告客户将会错过高价值的印象,这些印象可能会导致行动,而宣传活动将无法达到预期效果。
CTR和CVR与用户在特定环境下与广告互动的意图直接相关,它们基本上很难直接建模和预测。实际上,CVR甚至比CTR更难估计,因为转换事件比点击事件要少得多。另外,视图转换在日志记录过程中有更长的延迟(有时长达一周),这使得离线建模更加困难。最后,广告服务系统需要实时运行,需要在几毫秒内完成CVR或CTR估计、最优竞价价格计算和提交到交易所的竞价。
本文提出了一种简单而有效的估计广告印象CVR的方法,并应用于DSP中。我们的转化率估计方法在用户、发布者和广告商数据层次的跨产品的不同选择层次上建立了转换事件的模型,并分别用二项分布估计了分布参数。使用逻辑回归将这些单独的估计器组合起来,以获得一个最终的估计,该估计可以更准确地预测每种印象的转换结果。
本文的其余部分如下。在第二章中,我们回顾了广告调用流程,阐述了我们的问题,并讨论了文献中的相关工作。在3中,我们使用跨数据层次的过去性能观察来描述CVR估计器,并描述使用逻辑回归作为结合这些个别率估计以提高预测性能的一种手段。在DSP的CVR建模过程中遇到的各种实际问题和提出的解决方案在4中进行了讨论。彻底的实验结果在5和6列出一些结论和可能的未来工作。
BACKGROUND AND RELATED WORK
在本节中,我们首先回顾广告调用流。然后,我们提出了一个给定广告印象的事件转化率估算问题。最后,我们解释了用户、发布者和广告客户的数据层次结构,并讨论了之前在文献中有关估计罕见事件的一些工作。
Overview of Ad Call Flow
为了正确地理解所提出的方法,让我们使用图1中简化的ad调用流。考虑这个图形周围的矩形边框,右边是供应方或发行方。供应方提供可以放置广告的页面。左边是需求或广告主的一面。需求方提供广告和约束,如目标和预算约束。
给定一个具有个人资料的用户、具有某些上下文的页面以及来自不同广告商的活动(其中活动包括一些约束和广告),目标(有时称为计算式广告的基本问题)是在约束条件下为用户和页面找到最好的广告。接下来将借助图1中编号的步骤来解释这一过程的机制。
当一个用户(带有id标签)在一个网页(带有URL)上进行浏览时,调用过程开始了。调用首先到达与发布者集成的广告交换台。广告交换台将和发送给需求方平台(DSP),以请求一个广告和一个出价。请求通常包含其他信息,如用于目标定位的地理位置。合作dsp可能响应或不响应该请求;那些响应的(投标dsp)需要使用和来分别收集关于用户和页面的更多信息。用户和页面的信息通常是通过数据管理平台提供的。竞价的dsp也通过他们以前创建的广告搜索,找到一组候选广告,可以针对用户和页面。本文的贡献是在决策引擎的基础上,从候选广告中选择最优的广告并计算相应的出价。
出价的dsp返回他们的提议广告和出价对到广告交换台。一旦广告交换台收集了所有的出价,它将运行一个拍卖(通常是第二次价格拍卖)并确定中标的出价和相应的广告。然后,它将获胜的广告和创意的位置传回浏览器。然后,浏览器收集创造性的内容,并最终将页面返回给用户。
注意,整个流程需要在十分之一秒内完成,这样用户在浏览器上打开页面时就可以看到带有广告的页面。此外,顶级的dsp每秒可以接到多达50万次这样的广告呼叫,因为数亿用户在任何时候都在浏览器上打开页面。这种延迟和吞吐量限制给每个竞价DSP和它们的决策引擎带来了极大的时间限制。该方法在时间约束条件下运行良好。
Problem Setup and Formulation
假设 U, P, A 分别代表用户、页面、广告。目标是在所有n个广告中找到具有最高转换概率的广告。数学上,可以写成
注意,在单个用户级别上,事件只有两种可能的结果:转换或不转换。然后我们可以看到一个转换事件可以被建模为一个伯努利随机变量。
等式1的写法变为:
对转换事件结果建模的一种方法是使用一组显式的特性来表示用户、发布者和广告,并构建一个分类模型。这种方法的例子可以在赞助搜索广告中找到[10,15]。由于低层次的数据特征与用户对显示广告采取行动的直接意图关联不大,因此基于这些特征的模型在我们的环境中表现不佳。另一个想法是计算这个广告在这个网站上向“相似”用户显示的次数,然后观察这些印象中有多少导致了转换。然后,该用户的转化率可以简单地估计为所有相似用户之间的总转化率除以总印象数。这种用户分组可以通过基于某种相似性度量的显式聚类实现,也可以通过使用数据层次结构的隐式实现,我们将在下一节中解释。
Data Hierarchies
在显示广告上下文中,用户、发布者和广告客户相关的数据可以视为遵循某种层次结构。例如,DSP中的每个广告都可以被认为属于一个广告活动,而这个广告活动又属于一个广告主(例如,广告主:Acme Cars -》广告活动: 2011年年终销售 -> 广告:难以置信的年终销售活动!)类似地,将显示广告的网站位于由出版商拥有的顶级域(TLD)之下,而出版商本身可能属于基于其主要内容的某个类别(例如,出版商类型:News -> publisher: Acme City Times - > Page: Auto News)。图2.2展示了用户、发布者和广告客户数据的层次结构示例分类。请注意,此图不代表Turn Inc.的数据分类,它主要是为了说明目的和清晰的表示。
数据层次结构使我们能够定义显式或隐式用户集群。显性用户聚类,正如我们所猜测的那样,是基于一组特征(如人口统计信息、地理特征、收入水平、经常访问的网站类型、活动水平等)来表示每个用户,并基于一些相似度量(如欧氏距离)来聚类。另一方面,隐式集群是基于使用数据层次结构而不是用户特性的。例如,访问某个类别网站(如体育)的用户组可以视为一个隐式集群。我们可以用笛卡尔乘积{Users×Publisher Type}来表示这个分组。作为另一个例子,我们还可以考虑向广告活动(比如Acme Cars)显示广告的所有用户在特定站点(例如,Acme Times Autos)上的“年度结束销售”,可以用笛卡尔产品表示{用户出版商类型广告}。如果我们假设用户、发布者和广告主数据在它们各自的数据层次结构中有’ Lu、’ Lp和’ La ‘级别,那么就有’Lu×’ Lp×La’这样一个可能的隐式用户集群。那么,给定adrequest ={user: ui, page: pj},我们可以从数据层次结构中确定合适的显式和隐式用户集群,并使用每个级别的过去计数数据(即印象数量和转换数量)来获得不同的估计
CONVERSION RATE ESTIMATION
在本节中,我们将详细介绍我们的换算率(CVR)估算方法。我们首先重新访问数据层次结构,并解释过去来自层次结构中不同层次的观察如何产生一个给定广告呼叫所需CVR的弱估计量。然后,我们讨论如何使用逻辑回归将这些弱估计量结合起来得到更准确的估计量。
Past Performance at Different Hierarchical Levels
回想一下等式(1),给定一个由{user: ui, page: pj}参数化的ad请求,我们希望找到CVR值最高的ad ak
∗ijk。正如我们在上一节中所解释的那样,如果我们可以确定一组用户,他们的用户
CVR与用户ui相似,我们可以做如下近似:
其中,Cui表示ui所属的用户集群。
请注意,这种近似依赖于一个明确的用户聚类,并观察在Cui中访问pj网站时被显示的所有用户。那么,pijk最简单的可能估计为:
这个方法的精确性有两个前提:
- 用户集群找的精确。
- 用户集群的数目较大,不然不具有统计意义。
这个数据稀疏问题可以通过增加用户、发布者和广告商的数据层次来缓解,因为在更高的层次上肯定会比在更低的层次上有更多的观察结果。然后我们可以将式(6)推广为:
Cpj和Cak分别定义了网页和广告客户的分组。这些分组是由各自的数据层次所指示的,如图2.2所示。
最后
以上就是明亮玉米最近收集整理的关于Estimating Conversion Rate in Display Advertising from Past Performance Data 论文阅读笔记摘要INTRODUCTIONBACKGROUND AND RELATED WORKCONVERSION RATE ESTIMATION的全部内容,更多相关Estimating内容请搜索靠谱客的其他文章。
发表评论 取消回复