Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
- 论文ID: 2308.15701
- 标题: A Survey on Multi-Behavior Sequential Recommendation
- 作者: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
- 分类: cs.IR (Information Retrieval)
- 发表时间: 2023年8月30日 (arXiv预印本)
- 论文链接: https://arxiv.org/abs/2308.15701
- 期刊: IEEE Transactions on Knowledge and Data Engineering
推荐系统旨在解决传统信息检索系统中的信息过载问题,专注于从海量信息中为用户推荐最感兴趣的内容。用户与系统交互行为通常具有序列性和异构性特点,这促使了多行为序列推荐(MBSR)的提出。MBSR是一个相对新颖且值得深入研究的方向,通过合适的建模可以实现最先进的推荐效果。本综述旨在阐明MBSR问题,详细介绍其问题定义、应用场景和面临的挑战,并对MBSR方法进行分类,包括基于邻域的方法、矩阵分解方法和深度学习方法。
- 信息过载问题: 随着互联网信息爆炸式增长,用户面临从海量信息中快速获取所需内容的挑战
- 传统推荐系统的局限:
- 单行为推荐(SBR)仅考虑单一类型的用户反馈,容易遇到数据稀疏和冷启动问题
- 静态推荐方法忽略了用户行为的时序性和动态变化
- 行为异构性: 现实场景中用户与物品存在多种交互行为(浏览、加购物车、购买等)
- 序列依赖性: 用户行为具有天然的时序特征,体现了短期偏好和长期偏好的动态变化
- 实际应用需求: 电商、视频推荐、新闻推荐等领域迫切需要更贴近真实用户行为的推荐算法
- 系统性综述: 首次对MBSR领域进行全面系统的调研,填补了该新兴领域缺乏相关综述的空白
- 多维度分类体系: 提出了基于技术、数据和建模三个维度的MBSR方法分类框架
- 深入技术分析: 详细分析了各类方法的优缺点,为研究者提供了清晰的技术路线图
- 未来方向指导: 提出了五个有价值的未来研究方向,为该领域的发展提供指导
MBSR问题主要关注异构反馈序列中的下一个物品推荐。给定:
输入为(用户, 异构行为序列)对: (u,Su),其中:
Su={(iu1,fu1),...,(iut,fut),...,(iu∣Su∣,fu∣Su∣)}
目标是预测用户u在第(t+1)时刻对候选物品j的偏好值 r^u,t+1,j,并生成Top-K推荐列表。
- 核心思想: 利用用户或物品间的相似性进行推荐
- 代表工作: BIS (Bidirectional Item Similarity)
- 优势: 易于维护,可解释性强
- 劣势: 缺乏传递性,难以捕获复杂用户偏好
- 核心思想: 将用户-物品交互矩阵分解为低秩矩阵的内积
- 代表工作: TransRec++
- 创新点: 引入行为转移向量捕获序列关系和行为动态性
- 局限: 行为类型增多时模型复杂度急剧上升
RNN架构
- RLBL: 结合RNN和log-bilinear模型,使用行为特定转移矩阵
- RIB: 利用GRU和注意力机制建模微观行为
- BINN: 设计CLSTM和Bi-CLSTM处理多行为信息
- 优势: 适合序列建模,能存储短期记忆
- 劣势: 梯度消失/爆炸问题,计算效率低
GNN架构
- MGNN-SPred: 构建全局图捕获行为转移关系
- DMBGN: 针对优惠券兑换率预测任务设计
- GPG4HSR: 同时考虑全局图和个性化图
- BGNN: 区分同构和异构行为转移模式
- 优势: 能建模复杂关系,处理数据稀疏性强
- 劣势: 行为类型增多时图构建复杂度上升
- DMT: 使用MMoE进行多任务学习
- DFN: 通过注意力网络处理隐式反馈噪声
- NextIP: 将问题建模为物品预测和购买预测双任务
- MB-STR: 设计新颖的位置编码函数
- FLAG: 同时建模局部偏好、全局偏好和局部意图
- 优势: 并行计算能力强,长期依赖建模能力优秀
- 劣势: 对局部信息捕获相对较弱
混合架构
- MKM-SR: 结合GNN和GRU分别建模物品序列和行为序列
- KHGT: 融合Transformer和GNN,考虑物品关系信息
- 优势: 综合多种技术优势,性能提升显著
- 劣势: 模型复杂度高,调参困难
- 电商推荐: 预测用户购买行为,考虑浏览、加购物车、收藏等辅助行为
- 视频推荐: 以分享为目标行为,浏览为辅助行为
- 新闻推荐: 结合显式反馈(不喜欢)和隐式反馈(浏览)
- 准确性指标: Hit Rate, NDCG, Recall, Precision
- 多样性指标: Coverage, Diversity
- 效率指标: 训练时间、推理时间、内存消耗
- (物品,行为)对序列: 最常见的输入格式
- 行为特定子序列: 按行为类型分割的物品序列
- 行为无关物品序列: 忽略行为类型的物品序列
- 行为序列: 纯行为类型序列
- 深度学习方法占主导: 由于MBSR问题的复杂性,大多数工作采用深度学习方法
- Transformer表现优异: 在多个任务上展现出优于RNN和GNN的性能
- 混合方法潜力巨大: 结合多种技术的混合架构能够取得更好的推荐效果
- 注意力机制重要性: 几乎所有优秀方法都采用了某种形式的注意力机制
- 从单一到混合: 技术发展趋势从单一架构向混合架构演进
- 从局部到全局: 建模视角从局部序列扩展到全局图结构
- 从简单到复杂: 行为建模从简单嵌入发展到复杂转移关系
- 序列推荐(Sequential Recommendation): MBSR的基础,但仅考虑单一行为
- 多行为推荐(Multi-behavior Recommendation): 考虑异构行为但忽略序列性
- 会话推荐(Session-based Recommendation): 短期交互序列推荐
- 联邦推荐(Federated Recommendation): 隐私保护下的推荐
传统协同过滤 → 矩阵分解 → 深度学习 → 图神经网络 → Transformer → 混合架构
- 异构行为序列建模: 如何有效建模不同类型行为的序列关系
- 行为间关系建模: 捕获行为之间的依赖和转移关系
- 长短期偏好融合: 同时建模用户的长期稳定偏好和短期动态需求
- 噪声和偏差处理: 处理隐式反馈中的噪声和选择偏差问题
- 数据层面: 解决数据稀疏性、不平衡性、周期性和噪声问题
- 技术层面: 提高计算效率,增强模型泛化能力,结合多种互补技术
- 优化目标: 从单目标优化转向多目标联合优化
- 大语言模型: 探索LLM在MBSR中的应用潜力
- 可信性: 提高模型可解释性,保护用户隐私安全
- 全面性: 首次对MBSR领域进行系统性综述,覆盖面广泛
- 结构清晰: 多维度分类框架条理清楚,便于理解和应用
- 深度分析: 对每类方法的优缺点分析深入透彻
- 前瞻性: 提出的未来方向具有很强的指导价值
- 实用性: 为研究者和工程师提供了实用的技术路线图
- 实验对比缺失: 作为综述论文,缺乏统一基准下的方法对比实验
- 数据集分析不足: 对现有数据集的特点和局限性分析较少
- 工业应用讨论有限: 对工业界实际部署经验的讨论不够充分
- 理论分析薄弱: 缺乏对MBSR问题复杂度和可学习性的理论分析
- 学术贡献: 为新兴的MBSR领域建立了系统的知识体系
- 实用价值: 为工业界多行为推荐系统设计提供重要参考
- 研究指导: 明确了该领域的技术发展脉络和未来方向
- 标准制定: 有助于推动MBSR领域评估标准和基准的建立
- 研究入门: 为初学者提供全面的领域知识概览
- 技术选型: 为工程师选择合适的MBSR方法提供指导
- 学术研究: 为研究者确定研究方向和创新点提供参考
- 产业应用: 为企业构建多行为推荐系统提供技术路线
本文参考了107篇相关文献,涵盖了推荐系统、深度学习、图神经网络等多个领域的重要工作,为MBSR研究提供了坚实的理论基础和技术支撑。
总结: 这是一篇高质量的综述论文,系统梳理了多行为序列推荐这一新兴领域的研究现状,为该领域的发展奠定了重要基础。论文结构清晰、分析深入,对推动MBSR领域的理论发展和实际应用具有重要价值。