首页 存档 技术 查看内容

达观数据中国电信分享实录:推荐技术介绍

2018-3-30 13:00 |来自: 互联网 302 0

摘要: 导读:3月下旬,中国电信大数据技术团队邀请达观数据技术团队前去进行技术交流和互相学习。达观数据联合创始人文辉就“视频推荐技术”进行了详细的讲解,主要从达观推荐系统开发的概况、推荐系统的架构模块和达观推 ...


导读:3月下旬,中国电信大数据技术团队邀请达观数据技术团队前去进行技术交流和互相学习。达观数据联合创始人文辉就“视频推荐技术”进行了详细的讲解,主要从达观推荐系统开发的概况、推荐系统的架构模块和达观推荐算法来阐述,并针对操作中出现的问题分享了自己的观点。



推荐系统概况

说了那么多遍的推荐系统到底是什么且如何运用?很高兴和大家分享下经验。我们今天主要从视频推荐技术来延伸学习。互联网技术和社会化网络发展加速度,每天有大量包括博客,图片,视频,微博等等的信息发布到网上。对于以视频为主要流量导向的企业越来越难以发现用户对信息的需求,原因有多种,用户很难用合适的关键词来描述自己的需求,又或是用户无法对自己未知而又可能感兴趣的信息做出描述。我们开发视频推荐引擎,也是以大数据技术帮用户获取更丰富,更符合个人口味和更加有意义的信息。



视频推荐系统会根据用户的观看记录和行为,利用机器推荐算法为用户推荐其感兴趣的视频。智能推荐系统是为了解决千人一面的问题,防止用户看到的推荐结果都是千篇一律的,真正实现千人千面的个性化推荐效果,给用户更好的体验,给平台更好的留存和收益。

达观视频智能推荐系统的研发目标集中在以下方面:

推荐结果相关性明显提升

推荐结果的多样性提升

推荐结果的时效性提升

新颖的推荐理由自动生成功能

以上研发目标都是为了使视频推荐效果更加准确、及时,现经不断优化已经完成所有目标,但系统还在持续优化升级。

系统的效果上来看,我们要实现:

更完整的挖掘数据

多种优质推荐算法

完善的系统: 可靠性, 运算性能

更好的接口封装: 支持多种终端的接入

系统的组成上来看,系统主要包括以下几个方面,注意各个部分的功能不是单一和互斥的:

分布式推荐模块用户点击行为挖掘

离线推荐模块多个推荐算法合并

在线推荐模块实时推荐请求和计算

个性化推荐模块用户兴趣深度挖掘

推荐理由挖掘模块多种形态的理由

达观视频推荐系统不同于其他企业的部分是,从类型上来看相当多样化,分为个性化推荐、相关视频推荐和热门视频推荐三种,每种类型对应了不同的业务场景。


个性化推荐“想你所想

深入分析用户行为记录,挖掘用户的兴趣爱好,向用户推荐其感兴趣想看的视频,通常意义的推荐默认就是个性化推荐;


相关视频推荐“丰富扩展

通过深入分析网站视频之间的内在相关性,根据当前被浏览的某个视频为用户推荐其视频;


热门视频推荐“广而告之

为网站提供全站热门视频排行榜和分类热门视频排行榜

推荐系统的架构和模块

三层模型

为了解决待推荐item数量巨大和优先的计算资源之间的矛盾,同时将更多的资源投入到热门item的深度挖掘,我们引入了三层模型离线模块(offline)、近线模块(nearline)、在线模块(online)离线模块利用分布式平台上进离线挖掘,候选推荐结果每日带入离线计算服务器;近线模块在近线端进行挖掘,结合用户实时行为和离线模型结果,生成用户的推荐结果;在线模块负责整合离线结果和近线结果为最终输出用户的结果。从时效性上来看,离线(天级)

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部