当前位置:资讯 > 社会 > 正文
快手联合武汉大学提出用于序列推荐的多粒度神经模型
2022-06-06 09:30:58 来源: 机器之心

来自快手和武汉大学的研究者通过结合多兴趣学习和多层级图卷积聚合提出了一种多粒度神经模型,显著增强了精确学习用户复杂行为的能力,对用户不同层级下多种兴趣的细粒度建模为序列推荐领域的前沿研究拓宽了方向。该研究已被今年的 SIGIR 会议录取为长论文。

随着大众获取信息方式的移动化和碎片化,短视频分享平台(如快手、抖音)逐渐成为人们生活中获取信息和休闲娱乐的重要渠道。不断突破记录的 DAU 一方面伴随着巨大的商业价值,另一方面也给千人千面的推荐算法带来巨大的挑战。

在快手单列的流式推荐场景下,用户观看视频的序列化行为对于建模用户动态兴趣有着至关重要的作用。序列推荐旨在根据用户的行为历史来识别用户偏好的下一个商品 / 视频,但是传统序列推荐方法往往使用单个向量表征用户的动态兴趣。由于用户的观看历史中的兴趣是多样的,因此仅建模用户单一的动态兴趣很难达到理想的推荐效果。如何同时准确地捕捉用户动态且多样的兴趣,是当前短视频流式推荐的痛点。

另一方面,包括 TGSRec 和 SURGE 在内的图卷积聚合方法则选择将序列建模与图神经网络结合起来。基于历史商品之间的多级相关性来细化用户不同层级的偏好。然而,与多兴趣解决方案相比,这些方法忽略了多兴趣分解的好处。不幸的是,当前工作都没有意识到上述两种解决方案可以相互补充:通过聚合多级用户偏好来实现更精确的多兴趣提取以获得更好的推荐。总而言之,如何以多粒度的方式对多个兴趣进行建模是这篇论文旨在解决的问题。

这项研究提出了一个统一的多粒度神经模型 Multi-Grained Neural Model,简称 MGNM。通过结合多兴趣学习和图卷积聚合,达到对用户多粒度兴趣最佳的建模效果。该方法首先为用户学习历史交互商品的图结构和信息聚合路径;然后执行图形卷积以迭代的方式推导出商品表示,用来捕获用户在不同层级上的复杂偏好;接着通过提出的序列胶囊网络,将序列模式注入到多兴趣提取过程中,从而以多粒度方式实现更精确的兴趣学习。对来自不同场景的三个真实世界数据集的实验证明了 MGNM 相对于最先进基线的优越性。进一步的分析还表明,MGNM 在对多粒度级别的用户偏好理解方面是鲁棒且有效的。

方法

具体来说,所提出的 MGNM 模型由两个主要组件构成:用户感知图卷积和序列胶囊网络。用户感知图卷积组件将原始序列转换为用户感知的自适应图,通过执行图卷积以迭代地方式推导出商品表示,用于捕获用户不同级别偏好。序列胶囊网络组件将时间序列信息引入传统胶囊网络来提取多兴趣的序列化模式。通过多层级和多兴趣的结合,能够更加准确的建模用户的多粒度兴趣。

为了从用户历史序列中提取复杂和高阶的用户兴趣,该研究利用图结构来自适应的建模不同历史商品之间的相关性距离。给定用户的历史行为序列,首先将商品序列转换为一个全连接商品图如图 4(1),而不同商品之间的距离根据用户嵌入以及两个商品的嵌入联合计算得到。用户嵌入被用来实现用户感知的图构建。也就是说,相同的两个商品对对于不同的用户可能具有不同的相关性值。通过这种自适应的图连接方式,在训练过程中梯度通过更新商品和用户的嵌入,进而调整图的连接方式。同时为了使得兴趣图具有足够的辨别力,研究人员在邻接矩阵上添加 L1正则化来逼近一定的稀疏度。最终利用自适应的用户历史兴趣图,通过用户感知的图卷积得到 L 层的卷积输出见图 4(2)。每一层输出的商品表征代表不同层级的商品信息,对应着后续提取不同层级的用户兴趣,卷积的层数越多表示用户的兴趣越高阶越复杂。

本研究主要利用图模型建模用户多层级(multi-level)历史行为表征、利用时序增强的胶囊网络提取用户多兴趣(multi-interest)兴趣向量。提出的 MGNM 细粒度神经序列推荐模型,在三个真实推荐场景数据集中均有比较突出的表现。同时大量实验和可视化分析证明了 multi-level 和 multi-interest 建模思想对推荐表现提升的重要影响。

责任编辑:zN_2318