4月12日,前海征信“好信杯”大数据算法大赛第一期分享会圆满举行。来自平安集团的数据建模高手邱高思豪,为大家详解了场景化风控、迁移学习等有关知识,并送上学习资料包,干货满满。以下是分享会实录的第二部分,干货自取~ 迁移学习 多任务学习是一种归纳式迁移学习,主要目标是利用隐含在多个相关任务的训练信号中的特定领域信息来提高泛化能力,多任务学习通过使用共享表示并行训练多个任务来完成这一目标。拿大家经常使用的school data做个简单的对比,school data是用来预测学生成绩的回归问题的数据集,总共有139个中学的15362个学生,其中每一个中学都可以看作是一个预测任务。单任务学习就是忽略任务之间可能存在的关系分别学习139个回归函数进行分数的预测,或者直接将139个学校的所有数据放到一起学习一个回归函数进行预测。而多任务学习则看重任务之间的联系,通过联合学习,同时对139个任务学习不同的回归函数,既考虑到了任务之间的差别,又考虑到任务之间的联系,这也是多任务学习最重要的思想之一。 目前多任务学习方法大致可以总结为两类,一是不同任务之间共享相同的参数(common parameter),二是挖掘不同任务之间隐藏的共有数据特征(latentfeature)。
基于边缘概率分布差异的领域适应学习算法是目前研究最多的一类算法。算法主要围绕实例加权和均值中心对齐等方法上。 在目标领域,根据统计学习理论,给定损失函数(x,y, |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|