多场景验证有效 排序模型必定要尝试的特色交叉技巧

  • 电脑网络维修
  • 2024-11-15

当天给大家引见两篇经典的上班,这两篇上班都是针对介绍系统中排序模型的优化,方法有一些相似之处,都是应用门控网络对底层特色启动交叉。 最关键的在于,这类方法曾经在很多实在业务场景中被验证成果清楚 ,十分值得还没有运行这类方法的同窗启动尝试。

论文题目 :MaskNet: Introducing Feature-Wise Multiplication to CTR Ranking Models by Instance-Guided Mask

下载地址 :​ ​​ ​

MaskNet是2021年宣布的一篇上班,引入instance-guided的mask,并经常使用该mask对embedding layer和hidden layer启动element wise乘法,成功bit-wise的留意力机制。本文在三个工业数据集上验证了MaskNet的有效性,证实了本文方法能够有效捕捉高阶特色交互。

MaskNet的外围模块是Instance-Guided Mask,结构如下图所示,由两层FC layer组成,第一层称为aggregation layer,第二层为projection layer。输入为feature embedding layer。留意第一层FC layer宽度较宽,第二层FC layer宽度相对较小,坚持和输入维度相反。失掉mask之后可以将其用于embedding层或许是隐层。

instance-guided mask可以以为是一种不凡的bit-wise的attention机制或许是门机制,经常使用instance中蕴含的global 高低文消息指点训练中的参数降级,有效捕捉复杂特色交互。mask中数值大的元素以为更关键,可以boost emb/hidden中的对应元素。mask中数值小的元素以为相对来说不关键或许以为是噪音,相应的 emb/hidden中的对应元素会被减小,到达弱化噪音,强化有用信号的指标。

基于Instance-Guided Mask可以组成MaskNet中的基础结构,MaskBlock,蕴含三个组件:layer normalization, instance-guided mask, feed-forward hidden layer,可以有两种输入,当输入为Feature Embedding时,计算方法如下:

当输入为上一层MaskBlock的输入时,多个MaskBlock可以堆叠构成一个更深的网络:

MaskBlock作为一个基本的构成单元,可以用于搭建Serial Model(SerMaskNet)和Parallel Model(ParaMaskNet),构成最终的MaskNet结构。其中SerMaskNet是相似于期间序列预估义务,ParaMaskNet相似于多专家网络/多头留意力机制。两种网络结构图如下所示:

本文在三个工业CTR数据集上验证了MaskNet的有效性,SermaskNet在Malware和Avazu数据集取得最优成果,在Criteo数据集上取得次优成果。ParaMastNet在Criteo数据集上取得最优成果,在Malware和Avazu数据集上取得次优成果。

论文题目 :Kuaishou-PEPNet: Parameter and Embedding Personalized Network for Infusing with Personalized Prior Information

下载地址 :​ ​​ ​

PEPNet是快手在2023年KDD宣布的一篇上班,但是其在宣布之前就曾经在多个场景取得了清楚成果,程维排序模型的基础组件之一。

不同的场景中,user和item有堆叠,因此不同场景中存在特性。不同的task也存在依赖相关。为每个场景中的每个义务训练独自模型,开发老本和后续迭代老本较大,并且因为没有充沛应用场景和义务之间的特性,只能失掉次优解。而将一切数据混合训练会因为多个场景数据量和多个义务指标的稠密性产生跷跷板现象。目前已有的解法包括以下两种:

multi-domain方法 :将多个畛域的特色对齐,但是疏忽了多个target之间的依赖;

multi-task方法 :拟合多个target的散布但是疏忽了多个domain特色空间的语义差异;

事实中的介绍系统是一个 multi-task && multi-domain 疑问,目前工业界不足在这种疑问上的解法。

特性化建模一直是介绍系统的外围。multi-domain && multi-task义务可以以为是user和item在不同situation下的交互,因此特性化建模可以协助缓解multi-task && multi-domain中的double seesaw疑问。目前的很多做法在网络输入层经常使用特性化先验常识(如item_id, user_id等),但随着网络越来越深,这些特性化常识作用越来越小。因此本文提出了PEPNet, 在正确的中央以正确的模式添加用户特性化消息,经过增强特性化来消弭multi task && multi domain义务中的预估偏向。模型结构如下图所示:

:注入畛域特定的先验消息。经常使用domain-side特色作为输入,包括domain ID和domain特定的特性化数值特色,如用户行为/商品曝光的数值统计特色。℧

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/5743.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号