张彬(美团推荐算法高级研发工程师):2012年3月硕士毕业于北京邮电大学,有过两年的互联网广告工作经历,期间先后参与过user profile挖掘、实时竞价算法、ctr预估等多个核心项目,对RTB、DSP、DMP中的相关技术有较好的理解和认识,积累了丰富的经验。2013年初加入美团网,主要负责美团个性化推荐系统的构建和优化,通过完善召回算法和引入重排序模型等大幅度提高了系统的转化率。 美团作为全国领的本地生活服务平台,在本地生活服务推荐领域已经进行了一些探索,这个分享主要是对这些探索的一些总结。我们看到本地生活服务领域的推荐需要重度使用传统的推荐算法,同时也存在很强的特色。例如,在本地生活服务领域,商户的地理位置对用户的决策影响很大,针对这点我们做了大量基础工作。下面我们一同看下美团是如何实现个性化推荐的。 一、推荐美团的原因 1.活跃用户过亿,移动端交易占80%以上。 图1.美团移动交易占比逐年变化树状图 2.推荐方式: ◎推荐产品:10 推荐产品,每天服务 30M 用户 ◎推荐形式:User2Items、Item2Items、Personal push、Others ◎推荐实体: 图2.美团推荐实体选用 ◎推荐平台:Mobile、PC ◎其他方式:购买完成,评价完成,搜索无结果,附近团购,相关团购
图3.美团其他推荐方式
二、美团如今所面临的问题 1、用户购买与消费的空间距离很小 图4.分品类持券80%距离 2、用户购买与消费的时间差很短 图5.分品类持券时长 3、用户场景时刻在变化 如:地理位置不断变化,用户需求随位置而变,推荐的内容要适配这种变化等 4、用户行为稀疏,粘性不够强 相邻两次访问的时间间隔长,新用户流失比例高,生命周期偏短 5、数据多,用户请求量大 每天要处理的数据达到T级别,每天千万级的用户,上亿次请求
三、应对方案 针对上述诸多面临的问题,可采取如下等方案进行应对,如:强化地理位置特征;提高算法实时性;算法融合,个性化push;框架优化等。 1、地理位置 (1)对于地理位置的维度,可以通过实时地理位置、常去地理位置、工作地、居住地、消费地等位置信息进行确认。 (2)地理位置直接触发 离线:挖掘区域消费优质deal和区域购买优质deal
图6.地理位置触发示意 在线:获取用户的地理位置信息,对区域deal列表进行加 (3)根据用户的地理位置轨迹计算用户相似度,与协同的用户相似度叠加权 算法示意: User1:geo1:count1; geo2:count2; geo3:count3 …
User2:geo1’:count1’; geo2’:count2’; geo3’:count3’ … 图7.算法示意地理位置信息 (4)基于消费poi的相似度计算 Deal中包含的地理位置信息较弱 Poi同时包含了用户的偏好与商圈倾向 图8.poi的相似度计算图示 (5)作为重排序模型的特征 用户实时地理位置与deal所在poi的最近距离 用户常去地理位置与deal所在poi的最近距离 用户消费地理位置与deal所在poi的最近距离 2、实时推荐 对于实时推荐由于用户场景经常变化,需求随之而变;离线计算好结果的推荐方式适应性差;每次请求都要实时计算。 (1)实时数据流 图9.实时行为:搜索、筛选、收藏、浏览、下单 ①算法使用新的用户行为数据进行推荐 未转化行为实时反馈至推荐结果 图10.实时数据流程图 ②算法准实时更新 Itembased cf 小时级更新 看了又看:6% 提升 Userbased cf 准实时更新 增量计算 4小时更新一次 (2)实时rerank ◎子算法计算出来的权重考虑的因素太少 ◎不同子算法的权重不具有可比性 ◎模型选择 线性、非线性结合 ◎特征 deal维度的特征 user维度的特征 user、deal的交叉特征 距离特征 ◎在线特征抽取,模型实时计算 在线学习算法FTRL
(3)算法融合 |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|