转载自知乎,原文链接:从谷歌到阿里,谈谈工业界推荐系统多目标预估的两种范式
多目标是什么?为什么要多目标?
我们的大脑会同时学习多种不同的任务,无论我们是想将英文翻译成中文,还是想将中文翻译成德语,我们都是使用相同的大脑架构,也就是我们自己的脑袋。同理在我们的模型中,如果我们采用的是同一个网络来同时完成这两个任务,那么我们就可以把这个任务称为 多目标学习。
在推荐系统中,即使在同一个场景中,常常也有不只一个的业务目标。在Youtube的视频推荐中,推荐排序任务不仅需要考虑到用户点击率,完播率,也需要考虑到一些满意度指标,例如,对视频是否喜欢,用户观看后对视频的评分;在淘宝的信息流商品推荐中,需要考虑到点击率,也需要考虑转化率;而在一些内容场景中,需要考虑到点击和互动、关注、停留时长等指标。
用多个模型分别对这些指标进行一个排序,然后综合起来可以吗?
可以,但是会面临一些问题。第一,会面临比较大的线上开销,考虑一下你的场景至少可以承受多少rt吧。第二,一些目标的样本比较稀疏,还存在一些问题,例如,单独对CVR进行建模,存在样本选择偏差(Sample Selection Bias,SSB)和数据稀疏性(Data Sparisity,DS)问题,其实不好解决。
什么是SSB问题,什么又是DS问题,我们后面再讲,我们知道的是,多目标预估可以通过同一个模型,解决(或者说缓解)上面的两个问题,甚至带来场景效果上的提升。
讲完了必要性,下面进入正题,下面谈谈工业界推荐系统做多目标预估的两种范式。