Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings

Feiyang Pan, Shuokai Li, Xiang Ao, Pingzhong Tang, Qing He

Tsinghua University, Chinese Academy of Sciences

https://arxiv-export-lb.library.cornell.edu/pdf/1904.11547

点击率预估在计算广告中是最核心的问题之一。近期,embedding技巧,将广告id映射到低维空间表示,可以大幅提升点击率预估的准确性。

但是,这种学习方法需要大量数据,对于小日志数据的情形,对新广告的效果表现较差,此即冷启动问题。

这篇文章中,当新广告加入到候选集时,作者们旨在提升冷启动阶段和热身阶段的点击率预估效果。作者们提出元embedding,这是一种基于元学习的方法,对新广告id,可以学习产生期望的初始embedding。

作者们所提方法对新广告id训练了embedding生成器,其中基于梯度元学习方法充分利用了先前学到的广告。这种方法可以学习如何学到更好的embedding。对于新广告,训练的生成器初始化广告id的embedding时将内容和属性作为输入。

然后,生成的embedding相对其他现有的初始化方法可以加速热身阶段的模型拟合,可以比较好的处理只有少量打标样本可用的情形。

在3个真实数据集上的实验结果表明,元embedding可以显著提升冷启动和热身阶段的效果,作者们在6个现有点击率预估模型上验证了该效果,其中包含轻量级模型,比如因子分解机,也包含复杂深度模型,比如PNN和DeepFM。这种方法也可以用于转化率预估。

少部分广告占了大部分样本示例如下

9f9e8c7e18d763fe0f1b7ac4f64d4a68.png

这篇文章的主要贡献如下

1dfe86813878e06f77fae562e9286fb7.png

冷启动与热启动区别对比如下

0e0078fa4496e1edd27200bbcec25698.png

算法伪代码如下

f559aa8ed74ad67422ce58a242c65550.png

算法学习图示如下

5117e8418de56d08d704e1ce3508cbe1.png

元embedding生成图示如下

210ae0a0a66f377c5086131a9be85a30.png

数据集信息简介如下

0ada27bead2633739336c41dbc868d12.png

2386e1ba57a3d056478249f8c29f71ba.png

作者们在以下代表性算法上进行了测试

8736307baaa41889a199cd63da7843d7.png

数据分割之后信息统计如下

70ec48401c2871fd098ed538bce78f8c.png

实验步骤如下

26ffdbe4a88599e6e6859a234ec30057.png

98b8890b3ee8dcd3fdabe00b85f4f1be.png

模型效果衡量指标如下

54dfa929f3c5e23a4a82c45970bd4884.png

不同数据集上的指标优化汇总如下

c1b4a23fb7ae58e91c219fbcf876c29a.png

在不同数据集上元embedding对不同算法带来的影响对比如下

88dd0cf8329cfaebd633d82b6e8df946.png

a1d8832900c3b9b79d914c334504b1e0.png

b92206c2e09a0a834fde1ad2a304e7a2.png


              70f68386543c089c98e11a17848ea476.png我是分割线d8fcc4d86bed6c6343dbfa0c0cda769a.png


您可能感兴趣

KDD2021|华为提出对偶图增强embedding神经网络DG-ENN用于CTR预估

KDD2021|因果模型在实时竞价重复曝光次数中的应用

雅虎联合阿里提出转化率预估实用框架并用于在线展示广告

IJCAI2020|京东联合香港理工提出基于点击校准的注意力模型用于时延归因转化率预估

WSDM2022|阿里联合中科院提出特征协同作用网络CAN用于点击率预估(已开源)

WSDM2022|阿里提出合约广告自适应统一分配框架AUAF(已开源)

ICDM2019|阿里提出大规模个性化分发实时平滑算法并用于合约展示广告

微软提出实时竞价算法并用于效果展示广告分配

淘宝展示广告中的优化点击成本算法

在线定向广告中的预算控制算法

KDD2021|清华联合雅虎|斯坦福大学|纽约大学提出竞价隐藏算法MEOW

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐