2025-11-14T19:31:12.107456

Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems

Lyu, Wang, Zhang et al.
This paper designs and implements an explainable recommendation model that integrates knowledge graphs with structure-aware attention mechanisms. The model is built on graph neural networks and incorporates a multi-hop neighbor aggregation strategy. By integrating the structural information of knowledge graphs and dynamically assigning importance to different neighbors through an attention mechanism, the model enhances its ability to capture implicit preference relationships. In the proposed method, users and items are embedded into a unified graph structure. Multi-level semantic paths are constructed based on entities and relations in the knowledge graph to extract richer contextual information. During the rating prediction phase, recommendations are generated through the interaction between user and target item representations. The model is optimized using a binary cross-entropy loss function. Experiments conducted on the Amazon Books dataset validate the superior performance of the proposed model across various evaluation metrics. The model also shows good convergence and stability. These results further demonstrate the effectiveness and practicality of structure-aware attention mechanisms in knowledge graph-enhanced recommendation.
academic

Intégration de l'Attention Consciente de la Structure et des Graphes de Connaissances dans les Systèmes de Recommandation Explicables

Informations Fondamentales

  • ID de l'article : 2510.10109
  • Titre : Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems
  • Auteurs : Shuangquan Lyu (Carnegie Mellon University), Ming Wang (Trine University), Huajun Zhang (Syracuse University), Xiaoxuan Sun (Independent Researcher), Junjiang Lin (University of Toronto), Jiasen Zheng (Northwestern University)
  • Classification : cs.IR (Récupération d'Informations)
  • Date de Publication/Conférence : Prépublication 2024
  • Lien de l'article : https://arxiv.org/abs/2510.10109

Résumé

Cet article conçoit et implémente un modèle de recommandation explicable qui intègre les graphes de connaissances avec un mécanisme d'attention consciente de la structure. Le modèle est construit sur la base de réseaux de neurones graphiques et adopte une stratégie d'agrégation de voisins multi-sauts. En intégrant les informations structurelles du graphe de connaissances et en attribuant dynamiquement l'importance des différents voisins par le biais d'un mécanisme d'attention, le modèle améliore la capacité à capturer les relations de préférences implicites. Dans la méthode proposée, les utilisateurs et les articles sont intégrés dans une structure graphique unifiée, construisant des chemins sémantiques multi-niveaux basés sur les entités et les relations du graphe de connaissances pour extraire des informations contextuelles plus riches. Au stade de la prédiction des évaluations, les recommandations sont générées par l'interaction entre les représentations de l'utilisateur et de l'article cible. Le modèle est optimisé à l'aide d'une fonction de perte d'entropie croisée binaire. Les expériences menées sur l'ensemble de données Amazon Books valident les performances supérieures du modèle proposé sur diverses métriques d'évaluation, et le modèle montre également une bonne convergence et stabilité.

Contexte de Recherche et Motivation

Description du Problème

À l'ère de l'explosion informationnelle, les utilisateurs font face à une surcharge d'informations sans précédent. Les méthodes de recommandation traditionnelles telles que le filtrage collaboratif et les approches basées sur le contenu présentent des limitations significatives dans le traitement de la parcimonie, de la dimensionnalité élevée et des problèmes de démarrage à froid.

Importance de la Recherche

Les systèmes de recommandation jouent un rôle crucial sur les plateformes de commerce électronique, les plateformes vidéo et les réseaux sociaux. Avec le développement rapide de l'apprentissage profond et des grands modèles de langage, les systèmes de recommandation évoluent vers des architectures plus intelligentes et complexes. L'intégration de connaissances externes pour améliorer les performances de recommandation est devenue un point focal de recherche clé.

Limitations des Méthodes Existantes

  1. Intégration insuffisante du graphe de connaissances : L'intégration seule du graphe de connaissances ne suffit pas à libérer pleinement son potentiel dans les systèmes de recommandation
  2. Distinction insuffisante de l'importance des relations : Toutes les connexions ne contribuent pas de manière égale au processus de recommandation ; certains chemins d'association portent des informations plus significatives que d'autres
  3. Manque d'explicabilité : Les utilisateurs ont besoin non seulement de recommandations de haute qualité, mais aussi de transparence et d'explications des raisons des recommandations

Motivation de la Recherche

Concevoir un modèle de recommandation explicable combinant le graphe de connaissances et un mécanisme d'attention consciente de la structure est à la fois une nécessité pratique et une étape naturelle de l'évolution intelligente des systèmes de recommandation. Cette recherche contribue au développement de systèmes de recommandation plus complets, efficaces et fiables.

Contributions Principales

  1. Proposition d'une nouvelle architecture de recommandation explicable : Première intégration profonde du mécanisme d'attention consciente de la structure avec le graphe de connaissances, réalisant une double amélioration de la précision et de l'explicabilité
  2. Conception d'une stratégie d'agrégation de voisins multi-sauts : Capture efficace des chemins de relations de haute valeur dans le graphe de connaissances par l'attribution dynamique d'importance
  3. Implémentation d'un cadre d'optimisation de bout en bout : Construction d'une structure graphique utilisateur-article unifiée, supportant la construction de chemins sémantiques multi-niveaux et l'extraction d'informations contextuelles
  4. Validation de l'efficacité de la méthode : Réalisation d'améliorations significatives de performance sur l'ensemble de données Amazon Books, surpassant les méthodes de base existantes sur tous les indicateurs d'évaluation

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné un ensemble d'utilisateurs U, un ensemble d'articles I, un ensemble d'entités E et un ensemble de relations R dans le graphe de connaissances, l'objectif est de prédire le score de préférence de l'utilisateur u pour l'article i et de fournir des chemins de recommandation explicables. Chaque triplet est représenté comme (h,r,t) ∈ E×R×E, où h représente l'entité de tête, r représente le type de relation et t représente l'entité de queue.

Architecture du Modèle

1. Construction de la Structure Graphique

  • Mappage des utilisateurs et des articles aux nœuds dans la structure graphique
  • Connexion de diverses entités auxiliaires (catégories, attributs, marques, etc.) par le biais du graphe de connaissances
  • Construction d'informations de voisins multi-sauts pour former des associations sémantiques riches

2. Mécanisme d'Attention Consciente de la Structure

Pour l'ensemble de nœuds voisins N(i) du nœud i, calculer le poids d'attention α_ij pour chaque nœud voisin j∈N(i) :

α_ij = exp(LeakyRELU(a^T[Wh_i||Wh_j])) / Σ_{k∈N(i)} exp(LeakyRELU(a^T[Wh_i||Wh_k]))

Où :

  • h_i représente la représentation d'intégration initiale du nœud i
  • W est une matrice de poids apprenable
  • a est le vecteur d'attention
  • || représente l'opération de concaténation de vecteurs

3. Agrégation d'Informations et Apprentissage de Représentation

Agrégation des informations des voisins par les poids d'attention, construction de représentations d'intégration conjointes des utilisateurs et des articles. Les représentations de l'utilisateur u et de l'article i sont respectivement e_u et e_i, et la fonction de score finale adopte une forme de produit interne :

y_ui = e_u^T · e_i

4. Conception de la Fonction de Perte

Utilisation de l'entropie croisée binaire pour l'entraînement :

L = -Σ_{(u,i)∈D} [y_ui log y'_ui + (1-y_ui) log(1-y'_ui)]

Où D représente l'ensemble de données d'entraînement et y_ui ∈ {0,1} est la valeur d'étiquette indiquant si l'utilisateur u a interagi avec l'article i.

Points d'Innovation Technique

  1. Attribution dynamique d'importance : Apprentissage automatique du degré d'influence de différents voisins sur le nœud central par le biais du mécanisme d'attention consciente de la structure
  2. Chemins sémantiques multi-niveaux : Construction de chemins sémantiques multi-niveaux reliant l'utilisateur et l'article cible basée sur le graphe de connaissances
  3. Explicabilité de bout en bout : Non seulement amélioration de la précision des recommandations, mais aussi fourniture d'explications de recommandation par le biais de chemins traçables

Configuration Expérimentale

Ensemble de Données

Utilisation de l'ensemble de données Amazon Books comme base expérimentale :

  • Source de données : Enregistrements réels d'interactions utilisateur d'une plateforme de commerce électronique en ligne
  • Contenu des données : Incluant les évaluations, les horodatages des commentaires et les métadonnées des produits
  • Informations du graphe de connaissances : Catégories de produits, marques, auteurs et autres entités et relations
  • Prétraitement : Suppression des enregistrements anormaux et des entités peu fréquentes, conservation uniquement des échantillons de rétroaction positive avec une évaluation de 4 et plus

Métriques d'Évaluation

  • Precision@10 : Proportion d'articles pertinents parmi les 10 premiers recommandés
  • Recall@10 : Proportion d'articles pertinents rappelés parmi les 10 premiers par rapport au total des articles pertinents
  • NDCG@10 : Gain cumulatif actualisé normalisé tenant compte de la position de classement
  • MAP : Valeur moyenne de la précision moyenne

Méthodes de Comparaison

  • SGCN-SRec : Recommandation sociale basée sur réseau de convolution graphique sensible aux sentiments
  • SA-MPF : Cadre de prédiction masquée conscient de l'état
  • Csrec : Recommandation séquentielle d'une perspective causale
  • DNS-Rec : Recommandation de recherche d'architecture neurale consciente des données
  • SAQ-Rec : Recommandation d'alignement de satisfaction utilisateur basée sur les retours de questionnaire
  • Sim-Rec : Recommandation séquentielle de démarrage à froid intégrant la similarité d'articles
  • Linrec : Mécanisme d'attention linéaire pour la recommandation de séquences longues

Détails d'Implémentation

  • Plage de taux d'apprentissage : 0,001-0,004
  • Nombre d'epochs d'entraînement : 100+ epochs
  • Algorithme d'optimisation : Descente de gradient utilisant la perte d'entropie croisée binaire

Résultats Expérimentaux

Résultats Principaux

MéthodePrecision@10Recall@10NDCG@10MAP
SGCN-SRec0,2840,3950,3620,219
SA-MPF0,3010,4110,3740,231
Csrec0,2920,4030,3680,225
DNS-Rec0,3070,4170,3810,239
SAQ-Rec0,3150,4260,3880,247
Sim-Rec0,2980,4070,3700,228
Linrec0,2930,3820,3470,207
Notre Méthode0,3320,4430,4030,261

Conclusions Clés :

  • Réalisation des meilleures performances sur tous les indicateurs d'évaluation
  • Precision@10 atteint 0,332, Recall@10 atteint 0,443, surpassant significativement les méthodes de base
  • NDCG@10 de 0,403 et MAP de 0,261, démontrant une qualité de classement excellente

Analyse de Sensibilité des Hyperparamètres

Taux d'ApprentissagePrecision@10Recall@10NDCG@10MAP
0,0040,3010,4180,3760,234
0,0030,3190,4340,3920,249
0,0020,3270,4400,3990,256
0,0010,3320,4430,4030,261

Résultats de l'Analyse :

  • Le taux d'apprentissage a un impact significatif sur les performances du modèle
  • Un taux d'apprentissage plus élevé (0,004) entraîne une instabilité d'entraînement
  • Le taux d'apprentissage optimal est 0,001, auquel le modèle atteint les performances optimales

Analyse de Convergence

Selon le graphique de décroissance de la fonction de perte :

  • Décroissance rapide de la perte au cours des 50 premiers epochs, capture rapide des caractéristiques fondamentales par le modèle
  • Courbe de perte progressivement aplanie dans les phases d'entraînement ultérieures, réduction significative des fluctuations
  • Réduction et stabilisation de l'écart entre la perte d'entraînement et la perte de validation, indiquant une bonne convergence du modèle et l'absence de surapprentissage

Travaux Connexes

Directions de Recherche Principales

  1. Recommandation par réseaux de neurones graphiques : Utilisation des GNN pour capturer les structures de relations complexes et les associations sémantiques
  2. Recommandation améliorée par graphe de connaissances : Utilisation de connaissances externes pour atténuer la parcimonie et les problèmes de démarrage à froid
  3. Mécanisme d'attention : Attribution dynamique des poids d'importance à différentes informations
  4. Recommandation explicable : Fourniture de transparence et de compréhensibilité des décisions de recommandation

Avantages de Cet Article par Rapport aux Travaux Connexes

  1. Intégration innovante : Première fusion profonde de l'attention consciente de la structure avec le graphe de connaissances
  2. Optimisation de bout en bout : Conception d'architecture unifiée supportant l'entraînement conjoint
  3. Double objectif : Optimisation simultanée de la précision et de l'explicabilité
  4. Validation empirique : Vérification de l'efficacité de la méthode sur des ensembles de données réels

Conclusion et Discussion

Conclusions Principales

  1. Le mécanisme d'attention consciente de la structure peut identifier efficacement les relations de haute valeur dans le graphe de connaissances
  2. La stratégie d'agrégation de voisins multi-sauts améliore significativement la capacité de capture des informations sémantiques
  3. La méthode proposée réalise des améliorations significatives en termes de précision et d'explicabilité
  4. Le modèle démontre une bonne convergence et une bonne capacité de généralisation

Limitations

  1. Complexité de calcul : L'agrégation de voisins multi-sauts et le calcul d'attention augmentent la complexité du modèle
  2. Dépendance aux données : Les performances du modèle dépendent de la qualité et de l'exhaustivité du graphe de connaissances
  3. Scalabilité : L'extensibilité sur les structures graphiques à grande échelle nécessite une vérification supplémentaire
  4. Adaptabilité dynamique : Capacité limitée d'adaptation aux préférences utilisateur changeantes dynamiquement

Directions Futures

  1. Modélisation de graphes dynamiques : Exploration de l'impact de l'évolution structurelle sur la modélisation des intérêts utilisateur
  2. Intégration de l'inférence causale : Combinaison de mécanismes d'inférence causale pour améliorer l'adaptabilité des stratégies de recommandation
  3. Fusion d'apprentissage par renforcement : Amélioration de la capacité d'auto-adaptation des stratégies de recommandation dans les scénarios multi-objectifs
  4. Transfert inter-domaines : Étude de la capacité de transfert du modèle entre différents domaines

Évaluation Approfondie

Points Forts

  1. Forte innovativité technique : La fusion profonde de l'attention consciente de la structure avec le graphe de connaissances présente une nouveauté
  2. Conception expérimentale complète : Incluant des expériences de comparaison complètes, une analyse des hyperparamètres et une vérification de convergence
  3. Amélioration significative des performances : Améliorations évidentes sur tous les indicateurs d'évaluation
  4. Valeur pratique élevée : Applicable à plusieurs scénarios de recommandation tels que le commerce électronique et les réseaux sociaux
  5. Forte explicabilité : Fourniture d'explications de recommandation par le biais de chemins sémantiques, renforçant la confiance des utilisateurs

Insuffisances

  1. Analyse insuffisante des frais de calcul : Manque d'analyse détaillée de la complexité temporelle et spatiale
  2. Ensemble de données unique : Vérification uniquement sur l'ensemble de données Amazon Books, la généralisation nécessite une vérification supplémentaire
  3. Absence d'expériences d'ablation : Manque d'expériences d'ablation détaillées pour analyser les contributions spécifiques de chaque composant
  4. Évaluation insuffisante de l'explicabilité : Manque d'évaluation quantitative de la qualité des explications générées
  5. Sélection des méthodes de comparaison : Certaines méthodes de base sont relativement anciennes, manque de comparaison avec les méthodes SOTA les plus récentes

Impact

  1. Contribution académique : Fourniture d'une nouvelle voie technique pour la recommandation améliorée par graphe de connaissances
  2. Valeur pratique : La méthode possède une bonne faisabilité d'implémentation d'ingénierie
  3. Signification inspirante : Fourniture d'un exemple pour l'application de l'attention consciente de la structure dans les systèmes de recommandation
  4. Potentiel de développement : Établissement d'une base pour la recherche future sur la recommandation explicable

Scénarios Applicables

  1. Recommandation de commerce électronique : Informations structurées riches telles que les catégories et les marques de produits
  2. Recommandation de contenu : Modélisation des relations de sujet et d'auteur pour les actualités, vidéos, etc.
  3. Recommandation sociale : Modélisation conjointe du réseau social utilisateur et du graphe d'intérêts
  4. Recommandation intensive en connaissances : Scénarios nécessitant une compréhension sémantique profonde tels que les articles académiques et les documents professionnels

Références

L'article cite 31 articles connexes, couvrant plusieurs domaines tels que les systèmes de recommandation, les réseaux de neurones graphiques, les graphes de connaissances et les mécanismes d'attention, fournissant une base théorique solide et un soutien technique pour la recherche.


Évaluation Générale : Cet article démontre des performances excellentes en termes d'innovation technique et de vérification expérimentale, apportant une contribution précieuse au développement des systèmes de recommandation explicables. Bien qu'il présente certaines limitations, ses idées principales et ses méthodes techniques possèdent une valeur académique importante et une signification pratique, justifiant une recherche et une promotion d'application approfondies.