2025-11-18T04:46:12.048153

A Survey on Multi-Behavior Sequential Recommendation

Chen, Li, Pan et al.
Recommender systems is set up to address the issue of information overload in traditional information retrieval systems, which is focused on recommending information that is of most interest to users from massive information. Generally, there is a sequential nature and heterogeneity to the behavior of a person interacting with a system, leading to the proposal of multi-behavior sequential recommendation (MBSR). MBSR is a relatively new and worthy direction for in-depth research, which can achieve state-of-the-art recommendation through suitable modeling, and some related works have been proposed. This survey aims to shed light on the MBSR problem. Firstly, we introduce MBSR in detail, including its problem definition, application scenarios and challenges faced. Secondly, we detail the classification of MBSR, including neighborhood-based methods, matrix factorization-based methods and deep learning-based methods, where we further classify the deep learning-based methods into different learning architectures based on RNN, GNN, Transformer, and generic architectures as well as architectures that integrate hybrid techniques. In each method, we present related works based on the data perspective and the modeling perspective, as well as analyze the strengths, weaknesses and features of these works. Finally, we discuss some promising future research directions to address the challenges and improve the current status of MBSR.
academic

Un Sondage sur la Recommandation Séquentielle Multi-Comportements

Informations Fondamentales

  • ID de l'article: 2308.15701
  • Titre: A Survey on Multi-Behavior Sequential Recommendation
  • Auteurs: Xiaoqing Chen, Zhitao Li, Weike Pan, Zhong Ming
  • Classification: cs.IR (Récupération d'Informations)
  • Date de publication: 30 août 2023 (préimpression arXiv)
  • Lien de l'article: https://arxiv.org/abs/2308.15701
  • Journal: IEEE Transactions on Knowledge and Data Engineering

Résumé

Les systèmes de recommandation visent à résoudre le problème de surcharge informationnelle dans les systèmes traditionnels de récupération d'informations, en se concentrant sur la recommandation aux utilisateurs du contenu qui les intéresse le plus parmi une vaste quantité d'informations. Les comportements d'interaction des utilisateurs avec le système présentent généralement des caractéristiques de séquentialité et d'hétérogénéité, ce qui a motivé l'émergence de la recommandation séquentielle multi-comportements (MBSR). La MBSR est un domaine relativement nouveau et méritant une étude approfondie, capable de réaliser des résultats de recommandation de pointe grâce à une modélisation appropriée. Ce sondage vise à clarifier le problème de la MBSR, à détailler sa définition, ses scénarios d'application et les défis auxquels elle fait face, et à classifier les méthodes de MBSR, notamment les méthodes basées sur le voisinage, les méthodes de factorisation matricielle et les méthodes d'apprentissage profond.

Contexte et Motivation de la Recherche

Contexte du Problème

  1. Problème de surcharge informationnelle: Avec la croissance exponentielle des informations sur Internet, les utilisateurs font face au défi d'accéder rapidement au contenu dont ils ont besoin parmi une vaste quantité d'informations
  2. Limitations des systèmes de recommandation traditionnels:
    • La recommandation mono-comportement (SBR) ne considère qu'un seul type de retour utilisateur, ce qui entraîne facilement des problèmes de rareté des données et de démarrage à froid
    • Les méthodes de recommandation statiques ignorent la nature temporelle et les changements dynamiques du comportement des utilisateurs

Motivation de la Recherche

  1. Hétérogénéité des comportements: Dans les scénarios réels, les utilisateurs et les articles présentent plusieurs types de comportements d'interaction (navigation, ajout au panier, achat, etc.)
  2. Dépendance séquentielle: Le comportement des utilisateurs possède des caractéristiques temporelles naturelles, reflétant les changements dynamiques des préférences à court et long terme
  3. Besoins d'application pratiques: Les domaines du commerce électronique, de la recommandation vidéo, de la recommandation d'actualités, etc., ont un besoin urgent d'algorithmes de recommandation plus proches du comportement réel des utilisateurs

Contributions Principales

  1. Sondage systématique: Premier sondage complet et systématique du domaine de la MBSR, comblant le vide d'absence de sondages connexes dans ce domaine émergent
  2. Système de classification multidimensionnel: Proposition d'un cadre de classification des méthodes de MBSR basé sur trois dimensions: technique, données et modélisation
  3. Analyse technique approfondie: Analyse détaillée des avantages et inconvénients de chaque catégorie de méthodes, fournissant aux chercheurs une feuille de route technologique claire
  4. Orientation des directions futures: Proposition de cinq directions de recherche futures précieuses, fournissant des orientations pour le développement du domaine

Détails des Méthodes

Définition de la Tâche

Le problème de la MBSR se concentre principalement sur la recommandation du prochain article dans une séquence de retours hétérogènes. Étant donné:

  • Ensemble d'utilisateurs U
  • Ensemble d'articles I
  • Ensemble de comportements F

L'entrée est une paire (utilisateur, séquence de comportements hétérogènes): (u,Su)(u, S_u), où: Su={(iu1,fu1),...,(iut,fut),...,(iuSu,fuSu)}S_u = \{(i_u^1, f_u^1), ..., (i_u^t, f_u^t), ..., (i_u^{|S_u|}, f_u^{|S_u|})\}

L'objectif est de prédire la valeur de préférence de l'utilisateur u pour l'article candidat j au moment (t+1) r^u,t+1,j\hat{r}_{u,t+1,j}, et de générer une liste de recommandations Top-K.

Système de Classification

1. Méthodes Basées sur le Voisinage

  • Idée centrale: Utiliser la similarité entre utilisateurs ou articles pour les recommandations
  • Travaux représentatifs: BIS (Bidirectional Item Similarity)
  • Avantages: Faciles à maintenir, forte interprétabilité
  • Inconvénients: Manque de transitivité, difficultés à capturer les préférences utilisateur complexes

2. Méthodes Basées sur la Factorisation Matricielle

  • Idée centrale: Décomposer la matrice d'interaction utilisateur-article en produit interne de matrices de faible rang
  • Travaux représentatifs: TransRec++
  • Points d'innovation: Introduction de vecteurs de transition de comportement pour capturer les relations séquentielles et la dynamique des comportements
  • Limitations: La complexité du modèle augmente considérablement avec l'augmentation du nombre de types de comportements

3. Méthodes Basées sur l'Apprentissage Profond (Contenu Principal)

Architecture RNN
  • RLBL: Combinaison de RNN et de modèle log-bilinéaire, utilisant des matrices de transition spécifiques aux comportements
  • RIB: Utilisation de GRU et de mécanismes d'attention pour modéliser les micro-comportements
  • BINN: Conception de CLSTM et Bi-CLSTM pour traiter les informations multi-comportements
  • Avantages: Appropriés pour la modélisation séquentielle, capable de stocker la mémoire à court terme
  • Inconvénients: Problèmes de disparition/explosion de gradients, efficacité de calcul faible
Architecture GNN
  • MGNN-SPred: Construction d'un graphe global pour capturer les relations de transition de comportement
  • DMBGN: Conception pour la tâche de prédiction du taux de remboursement de coupons
  • GPG4HSR: Considération simultanée des graphes globaux et personnalisés
  • BGNN: Distinction entre les modèles de transition de comportement homogènes et hétérogènes
  • Avantages: Capable de modéliser les relations complexes, forte capacité à traiter la rareté des données
  • Inconvénients: La complexité de la construction de graphes augmente avec l'augmentation du nombre de types de comportements
Architecture Transformer
  • DMT: Utilisation de MMoE pour l'apprentissage multi-tâches
  • DFN: Traitement du bruit de retour implicite par des réseaux d'attention
  • NextIP: Modélisation du problème comme double tâche de prédiction d'articles et de prédiction d'achat
  • MB-STR: Conception d'une fonction de codage de position novatrice
  • FLAG: Modélisation simultanée des préférences locales, des préférences globales et des intentions locales
  • Avantages: Forte capacité de calcul parallèle, excellente capacité de modélisation des dépendances à long terme
  • Inconvénients: Capture relativement faible des informations locales
Architecture Hybride
  • MKM-SR: Combinaison de GNN et GRU pour modéliser respectivement les séquences d'articles et les séquences de comportements
  • KHGT: Fusion de Transformer et GNN, considérant les informations de relations d'articles
  • Avantages: Synthèse des avantages de plusieurs techniques, amélioration significative des performances
  • Inconvénients: Complexité du modèle élevée, réglage des paramètres difficile

Configuration Expérimentale

Scénarios d'Application

  1. Recommandation de commerce électronique: Prédiction du comportement d'achat des utilisateurs, considérant les comportements auxiliaires tels que la navigation, l'ajout au panier et la mise en favori
  2. Recommandation vidéo: Partage comme comportement cible, navigation comme comportement auxiliaire
  3. Recommandation d'actualités: Combinaison de retours explicites (non-aime) et de retours implicites (navigation)

Métriques d'Évaluation

  • Métriques de précision: Hit Rate, NDCG, Recall, Precision
  • Métriques de diversité: Coverage, Diversity
  • Métriques d'efficacité: Temps d'entraînement, temps d'inférence, consommation mémoire

Classification par Perspective de Données

  1. Séquence de paires (article, comportement): Format d'entrée le plus courant
  2. Sous-séquences spécifiques aux comportements: Séquences d'articles segmentées par type de comportement
  3. Séquence d'articles indépendante des comportements: Séquence d'articles ignorant les types de comportement
  4. Séquence de comportements: Séquence de types de comportement pur

Résultats Expérimentaux

Principales Conclusions

  1. Domination des méthodes d'apprentissage profond: En raison de la complexité du problème de MBSR, la plupart des travaux adoptent des méthodes d'apprentissage profond
  2. Performance exceptionnelle de Transformer: Démonstration de performances supérieures à RNN et GNN sur plusieurs tâches
  3. Potentiel énorme des méthodes hybrides: Les architectures hybrides combinant plusieurs techniques peuvent obtenir de meilleurs résultats de recommandation
  4. Importance des mécanismes d'attention: Presque toutes les excellentes méthodes ont adopté une certaine forme de mécanisme d'attention

Tendances Technologiques

  1. Du simple au mixte: L'évolution technologique passe des architectures simples aux architectures hybrides
  2. Du local au global: La perspective de modélisation s'étend des séquences locales aux structures de graphes globales
  3. Du simple au complexe: La modélisation des comportements évolue des plongements simples aux relations de transition complexes

Travaux Connexes

Domaines de Recherche Associés

  1. Recommandation séquentielle (Sequential Recommendation): Fondement de la MBSR, mais ne considérant qu'un seul comportement
  2. Recommandation multi-comportements (Multi-behavior Recommendation): Considération des comportements hétérogènes mais ignorant la séquentialité
  3. Recommandation basée sur les sessions (Session-based Recommendation): Recommandation de séquences d'interaction à court terme
  4. Recommandation fédérée (Federated Recommendation): Recommandation sous protection de la vie privée

Trajectoire d'Évolution Technologique

Filtrage collaboratif traditionnel → Factorisation matricielle → Apprentissage profond → Réseaux de neurones graphiques → Transformer → Architecture hybride

Conclusion et Discussion

Défis Principaux

  1. Modélisation de séquences de comportements hétérogènes: Comment modéliser efficacement les relations séquentielles de différents types de comportements
  2. Modélisation des relations entre comportements: Capture des dépendances et des relations de transition entre comportements
  3. Fusion des préférences à court et long terme: Modélisation simultanée des préférences stables à long terme et des besoins dynamiques à court terme des utilisateurs
  4. Traitement du bruit et des biais: Traitement du bruit dans les retours implicites et des problèmes de biais de sélection

Directions Futures

  1. Niveau des données: Résolution de la rareté des données, de l'imbalance, de la périodicité et des problèmes de bruit
  2. Niveau technique: Amélioration de l'efficacité de calcul, renforcement de la capacité de généralisation du modèle, combinaison de techniques complémentaires multiples
  3. Objectifs d'optimisation: Transition de l'optimisation mono-objectif vers l'optimisation multi-objectif conjointe
  4. Modèles de langage de grande taille: Exploration du potentiel d'application des LLM dans la MBSR
  5. Fiabilité: Amélioration de l'interprétabilité du modèle, protection de la vie privée et de la sécurité des utilisateurs

Évaluation Approfondie

Points Forts

  1. Exhaustivité: Premier sondage systématique et complet du domaine de la MBSR, avec une couverture large
  2. Structure claire: Cadre de classification multidimensionnel bien organisé et facile à comprendre et appliquer
  3. Analyse approfondie: Analyse détaillée et pénétrante des avantages et inconvénients de chaque catégorie de méthodes
  4. Caractère prospectif: Les directions futures proposées ont une forte valeur directrice
  5. Utilité pratique: Fournit une feuille de route technologique pratique aux chercheurs et aux ingénieurs

Insuffisances

  1. Absence de comparaisons expérimentales: En tant que document de sondage, il manque des expériences de comparaison de méthodes sous un repère unifié
  2. Analyse insuffisante des ensembles de données: Analyse insuffisante des caractéristiques et limitations des ensembles de données existants
  3. Discussion limitée des applications industrielles: Discussion insuffisante sur l'expérience de déploiement réel dans l'industrie
  4. Analyse théorique faible: Manque d'analyse théorique de la complexité et de l'apprentissabilité du problème de MBSR

Impact

  1. Contribution académique: Établissement d'un système de connaissances systématique pour le domaine émergent de la MBSR
  2. Valeur pratique: Fourniture de références importantes pour la conception de systèmes de recommandation multi-comportements dans l'industrie
  3. Orientation de la recherche: Clarification de la trajectoire de développement technologique et des directions futures du domaine
  4. Établissement de normes: Contribution à la promotion de l'établissement de normes d'évaluation et de repères pour le domaine de la MBSR

Scénarios d'Application

  1. Initiation à la recherche: Fourniture d'un aperçu complet des connaissances du domaine pour les débutants
  2. Sélection technologique: Fourniture de conseils aux ingénieurs pour choisir des méthodes de MBSR appropriées
  3. Recherche académique: Fourniture de références pour que les chercheurs déterminent les directions de recherche et les points d'innovation
  4. Application industrielle: Fourniture d'une feuille de route technologique aux entreprises pour construire des systèmes de recommandation multi-comportements

Références Bibliographiques

Cet article fait référence à 107 articles connexes, couvrant des travaux importants dans plusieurs domaines tels que les systèmes de recommandation, l'apprentissage profond et les réseaux de neurones graphiques, fournissant une base théorique solide et un soutien technique pour la recherche en MBSR.


Résumé: Ceci est un article de sondage de haute qualité qui examine systématiquement l'état actuel de la recherche dans le domaine émergent de la recommandation séquentielle multi-comportements, jetant les bases importantes du développement du domaine. L'article possède une structure claire et une analyse approfondie, ayant une valeur importante pour promouvoir le développement théorique et l'application pratique du domaine de la MBSR.