2025-11-18T04:46:12.048153

A Survey on Multi-Behavior Sequential Recommendation

Chen, Li, Pan et al.
Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
academic

Una Encuesta sobre Recomendación Secuencial Multi-Comportamiento

Información Básica

  • ID del Artículo: 2308.15701
  • Título: A Survey on Multi-Behavior Sequential Recommendation
  • Autores: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
  • Clasificación: cs.IR (Recuperación de Información)
  • Fecha de Publicación: 30 de agosto de 2023 (preimpresión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2308.15701
  • Revista: IEEE Transactions on Knowledge and Data Engineering

Resumen

Los sistemas de recomendación tienen como objetivo resolver el problema de la sobrecarga de información en los sistemas tradicionales de recuperación de información, enfocándose en recomendar a los usuarios el contenido que más les interesa de una cantidad masiva de información. Las interacciones de los usuarios con el sistema generalmente presentan características de secuencialidad y heterogeneidad, lo que ha motivado la propuesta de recomendación secuencial multi-comportamiento (MBSR). MBSR es una dirección relativamente nueva y digna de investigación profunda que, mediante un modelado apropiado, puede lograr resultados de recomendación de última generación. Esta encuesta tiene como objetivo aclarar el problema de MBSR, describir en detalle su definición de problema, escenarios de aplicación y desafíos enfrentados, así como clasificar los métodos de MBSR, incluyendo métodos basados en vecindario, métodos de factorización matricial y métodos de aprendizaje profundo.

Antecedentes de Investigación y Motivación

Contexto del Problema

  1. Problema de Sobrecarga de Información: Con el crecimiento explosivo de la información en Internet, los usuarios enfrentan el desafío de obtener rápidamente el contenido necesario de una cantidad masiva de información
  2. Limitaciones de los Sistemas de Recomendación Tradicionales:
    • La recomendación de comportamiento único (SBR) solo considera un único tipo de retroalimentación del usuario, lo que fácilmente conduce a problemas de escasez de datos e inicio en frío
    • Los métodos de recomendación estática ignoran la naturaleza temporal y los cambios dinámicos del comportamiento del usuario

Motivación de la Investigación

  1. Heterogeneidad del Comportamiento: En escenarios reales, existen múltiples tipos de interacciones entre usuarios y elementos (navegación, agregar al carrito, compra, etc.)
  2. Dependencia Secuencial: El comportamiento del usuario tiene características temporales naturales, reflejando cambios dinámicos en preferencias a corto y largo plazo
  3. Necesidades de Aplicación Práctica: Campos como comercio electrónico, recomendación de videos y recomendación de noticias requieren urgentemente algoritmos de recomendación más cercanos al comportamiento real del usuario

Contribuciones Principales

  1. Encuesta Sistemática: Primera investigación integral y sistemática del campo de MBSR, llenando el vacío de la falta de encuestas relacionadas en este campo emergente
  2. Sistema de Clasificación Multidimensional: Propone un marco de clasificación de métodos MBSR basado en tres dimensiones: tecnología, datos y modelado
  3. Análisis Técnico Profundo: Analiza en detalle las ventajas y desventajas de cada clase de métodos, proporcionando a los investigadores una hoja de ruta técnica clara
  4. Orientación de Direcciones Futuras: Propone cinco direcciones de investigación futuras valiosas, proporcionando orientación para el desarrollo del campo

Explicación Detallada de Métodos

Definición de Tareas

El problema de MBSR se enfoca principalmente en la recomendación del siguiente elemento en secuencias de retroalimentación heterogénea. Dado:

  • Conjunto de usuarios U
  • Conjunto de elementos I
  • Conjunto de comportamientos F

La entrada es un par (usuario, secuencia de comportamiento heterogéneo): (u,Su)(u, S_u), donde: Su={(iu1,fu1),...,(iut,fut),...,(iuSu,fuSu)}S_u = \{(i_u^1, f_u^1), ..., (i_u^t, f_u^t), ..., (i_u^{|S_u|}, f_u^{|S_u|})\}

El objetivo es predecir el valor de preferencia del usuario u hacia el elemento candidato j en el momento (t+1) r^u,t+1,j\hat{r}_{u,t+1,j} y generar una lista de recomendaciones Top-K.

Sistema de Clasificación

1. Métodos Basados en Vecindario

  • Idea Central: Utilizar la similitud entre usuarios o elementos para hacer recomendaciones
  • Trabajos Representativos: BIS (Similitud Bidireccional de Elementos)
  • Ventajas: Fácil de mantener, fuerte interpretabilidad
  • Desventajas: Falta de transitividad, difícil de capturar preferencias complejas del usuario

2. Métodos Basados en Factorización Matricial

  • Idea Central: Descomponer la matriz de interacción usuario-elemento en el producto interno de matrices de bajo rango
  • Trabajos Representativos: TransRec++
  • Puntos de Innovación: Introduce vectores de transición de comportamiento para capturar relaciones secuenciales y dinamicidad del comportamiento
  • Limitaciones: La complejidad del modelo aumenta drásticamente cuando aumentan los tipos de comportamiento

3. Métodos Basados en Aprendizaje Profundo (Contenido Principal)

Arquitectura RNN
  • RLBL: Combina RNN y modelo log-bilineal, utilizando matrices de transición específicas del comportamiento
  • RIB: Utiliza GRU y mecanismo de atención para modelar micro-comportamientos
  • BINN: Diseña CLSTM y Bi-CLSTM para procesar información de múltiples comportamientos
  • Ventajas: Adecuado para modelado secuencial, puede almacenar memoria a corto plazo
  • Desventajas: Problemas de desvanecimiento/explosión de gradientes, baja eficiencia computacional
Arquitectura GNN
  • MGNN-SPred: Construye un gráfico global para capturar relaciones de transición de comportamiento
  • DMBGN: Diseñado para la tarea de predicción de tasa de canje de cupones
  • GPG4HSR: Considera simultáneamente gráficos globales y personalizados
  • BGNN: Distingue patrones de transición de comportamiento homogéneos y heterogéneos
  • Ventajas: Puede modelar relaciones complejas, fuerte capacidad de manejo de escasez de datos
  • Desventajas: La complejidad de construcción del gráfico aumenta cuando aumentan los tipos de comportamiento
Arquitectura Transformer
  • DMT: Utiliza MMoE para aprendizaje multitarea
  • DFN: Procesa ruido de retroalimentación implícita a través de redes de atención
  • NextIP: Modela el problema como predicción dual de elemento y compra
  • MB-STR: Diseña una función de codificación de posición novedosa
  • FLAG: Modela simultáneamente preferencia local, preferencia global e intención local
  • Ventajas: Fuerte capacidad de computación paralela, excelente capacidad de modelado de dependencias a largo plazo
  • Desventajas: Captura relativamente débil de información local
Arquitectura Híbrida
  • MKM-SR: Combina GNN y GRU para modelar respectivamente secuencias de elementos y secuencias de comportamiento
  • KHGT: Fusiona Transformer y GNN, considerando información de relaciones entre elementos
  • Ventajas: Sintetiza ventajas de múltiples técnicas, mejora significativa del rendimiento
  • Desventajas: Alta complejidad del modelo, dificultad en ajuste de parámetros

Configuración Experimental

Escenarios de Aplicación

  1. Recomendación de Comercio Electrónico: Predecir comportamiento de compra del usuario, considerando comportamientos auxiliares como navegación, agregar al carrito, favoritos
  2. Recomendación de Videos: Con compartir como comportamiento objetivo y navegación como comportamiento auxiliar
  3. Recomendación de Noticias: Combinando retroalimentación explícita (no me gusta) y retroalimentación implícita (navegación)

Métricas de Evaluación

  • Métricas de Precisión: Hit Rate, NDCG, Recall, Precision
  • Métricas de Diversidad: Coverage, Diversity
  • Métricas de Eficiencia: Tiempo de entrenamiento, tiempo de inferencia, consumo de memoria

Clasificación desde la Perspectiva de Datos

  1. Secuencia de Pares (Elemento, Comportamiento): Formato de entrada más común
  2. Subsecuencias Específicas de Comportamiento: Secuencias de elementos segmentadas por tipo de comportamiento
  3. Secuencia de Elementos Independiente del Comportamiento: Secuencias de elementos ignorando tipos de comportamiento
  4. Secuencia de Comportamiento: Secuencia de tipos de comportamiento puros

Resultados Experimentales

Hallazgos Principales

  1. Predominio de Métodos de Aprendizaje Profundo: Debido a la complejidad del problema de MBSR, la mayoría de trabajos adoptan métodos de aprendizaje profundo
  2. Desempeño Excepcional de Transformer: Demuestra rendimiento superior al de RNN y GNN en múltiples tareas
  3. Enorme Potencial de Métodos Híbridos: Las arquitecturas híbridas que combinan múltiples técnicas logran mejores resultados de recomendación
  4. Importancia del Mecanismo de Atención: Casi todos los métodos sobresalientes emplean alguna forma de mecanismo de atención

Tendencias Técnicas

  1. De Único a Híbrido: La tendencia de desarrollo técnico evoluciona de arquitecturas únicas a arquitecturas híbridas
  2. De Local a Global: La perspectiva de modelado se expande de secuencias locales a estructuras de gráficos globales
  3. De Simple a Complejo: El modelado de comportamiento evoluciona de incrustaciones simples a relaciones de transición complejas

Trabajos Relacionados

Campos de Investigación Asociados

  1. Recomendación Secuencial (Sequential Recommendation): Base de MBSR, pero solo considera comportamiento único
  2. Recomendación Multi-Comportamiento (Multi-behavior Recommendation): Considera comportamientos heterogéneos pero ignora la secuencialidad
  3. Recomendación Basada en Sesión (Session-based Recommendation): Recomendación de secuencias de interacción a corto plazo
  4. Recomendación Federada (Federated Recommendation): Recomendación bajo protección de privacidad

Ruta de Evolución Técnica

Filtrado Colaborativo Tradicional → Factorización Matricial → Aprendizaje Profundo → Redes Neuronales de Gráficos → Transformer → Arquitectura Híbrida

Conclusiones y Discusión

Desafíos Principales

  1. Modelado de Secuencias de Comportamiento Heterogéneo: Cómo modelar efectivamente relaciones secuenciales de diferentes tipos de comportamiento
  2. Modelado de Relaciones Entre Comportamientos: Capturar dependencias y relaciones de transición entre comportamientos
  3. Fusión de Preferencias a Corto y Largo Plazo: Modelar simultáneamente preferencias estables a largo plazo del usuario y necesidades dinámicas a corto plazo
  4. Procesamiento de Ruido y Sesgo: Manejar ruido en retroalimentación implícita y problemas de sesgo de selección

Direcciones Futuras

  1. Nivel de Datos: Resolver problemas de escasez de datos, desequilibrio, periodicidad y ruido
  2. Nivel Técnico: Mejorar eficiencia computacional, mejorar capacidad de generalización del modelo, combinar múltiples técnicas complementarias
  3. Objetivos de Optimización: Transición de optimización de objetivo único a optimización conjunta de múltiples objetivos
  4. Modelos de Lenguaje Grande: Explorar el potencial de aplicación de LLM en MBSR
  5. Confiabilidad: Mejorar interpretabilidad del modelo, proteger privacidad y seguridad del usuario

Evaluación Profunda

Fortalezas

  1. Integralidad: Primera encuesta sistemática del campo de MBSR, con cobertura amplia
  2. Estructura Clara: Marco de clasificación multidimensional bien organizado, fácil de entender y aplicar
  3. Análisis Profundo: Análisis detallado y exhaustivo de ventajas y desventajas de cada clase de métodos
  4. Prospectiva: Las direcciones futuras propuestas tienen gran valor orientador
  5. Practicidad: Proporciona una hoja de ruta técnica práctica para investigadores e ingenieros

Limitaciones

  1. Falta de Comparación Experimental: Como artículo de encuesta, carece de experimentos comparativos de métodos bajo un punto de referencia unificado
  2. Análisis Insuficiente de Conjuntos de Datos: Análisis limitado de características y limitaciones de conjuntos de datos existentes
  3. Discusión Limitada de Aplicaciones Industriales: Discusión insuficiente sobre experiencias de implementación práctica en la industria
  4. Análisis Teórico Débil: Falta de análisis teórico sobre complejidad del problema de MBSR y capacidad de aprendizaje

Impacto

  1. Contribución Académica: Establece un sistema de conocimiento sistemático para el campo emergente de MBSR
  2. Valor Práctico: Proporciona referencias importantes para el diseño de sistemas de recomendación multi-comportamiento en la industria
  3. Orientación de Investigación: Aclara la trayectoria de desarrollo técnico y direcciones futuras del campo
  4. Establecimiento de Estándares: Contribuye a promover el establecimiento de estándares de evaluación y puntos de referencia en el campo de MBSR

Escenarios Aplicables

  1. Introducción a la Investigación: Proporciona una descripción general completa del conocimiento del dominio para principiantes
  2. Selección de Tecnología: Proporciona orientación para que los ingenieros seleccionen métodos MBSR apropiados
  3. Investigación Académica: Proporciona referencias para que los investigadores determinen direcciones de investigación e innovación
  4. Aplicación Industrial: Proporciona una ruta técnica para que las empresas construyan sistemas de recomendación multi-comportamiento

Referencias

Este artículo hace referencia a 107 artículos relacionados, que abarcan trabajos importantes en múltiples campos incluyendo sistemas de recomendación, aprendizaje profundo y redes neuronales de gráficos, proporcionando una base teórica sólida y apoyo técnico para la investigación de MBSR.


Resumen: Este es un artículo de encuesta de alta calidad que sistematiza el estado actual de la investigación en el campo emergente de recomendación secuencial multi-comportamiento, sentando una base importante para el desarrollo de este campo. La estructura del artículo es clara, el análisis es profundo y tiene un valor importante para promover tanto el desarrollo teórico como la aplicación práctica del campo de MBSR.