2025-11-14T19:31:12.107456

Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems

Lyu, Wang, Zhang et al.

This paper designs and implements an explainable recommendation model that integrates knowledge graphs with structure-aware attention mechanisms. The model is built on graph neural networks and incorporates a multi-hop neighbor aggregation strategy. By integrating the structural information of knowledge graphs and dynamically assigning importance to different neighbors through an attention mechanism, the model enhances its ability to capture implicit preference relationships. In the proposed method, users and items are embedded into a unified graph structure. Multi-level semantic paths are constructed based on entities and relations in the knowledge graph to extract richer contextual information. During the rating prediction phase, recommendations are generated through the interaction between user and target item representations. The model is optimized using a binary cross-entropy loss function. Experiments conducted on the Amazon Books dataset validate the superior performance of the proposed model across various evaluation metrics. The model also shows good convergence and stability. These results further demonstrate the effectiveness and practicality of structure-aware attention mechanisms in knowledge graph-enhanced recommendation.

academic

Intégration de l'Attention Consciente de la Structure et des Graphes de Connaissances dans les Systèmes de Recommandation Explicables

Informations Fondamentales

ID de l'article : 2510.10109
Titre : Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems
Auteurs : Shuangquan Lyu (Carnegie Mellon University), Ming Wang (Trine University), Huajun Zhang (Syracuse University), Xiaoxuan Sun (Independent Researcher), Junjiang Lin (University of Toronto), Jiasen Zheng (Northwestern University)
Classification : cs.IR (Récupération d'Informations)
Date de Publication/Conférence : Prépublication 2024
Lien de l'article : https://arxiv.org/abs/2510.10109

Résumé

Cet article conçoit et implémente un modèle de recommandation explicable qui intègre les graphes de connaissances avec un mécanisme d'attention consciente de la structure. Le modèle est construit sur la base de réseaux de neurones graphiques et adopte une stratégie d'agrégation de voisins multi-sauts. En intégrant les informations structurelles du graphe de connaissances et en attribuant dynamiquement l'importance des différents voisins par le biais d'un mécanisme d'attention, le modèle améliore la capacité à capturer les relations de préférences implicites. Dans la méthode proposée, les utilisateurs et les articles sont intégrés dans une structure graphique unifiée, construisant des chemins sémantiques multi-niveaux basés sur les entités et les relations du graphe de connaissances pour extraire des informations contextuelles plus riches. Au stade de la prédiction des évaluations, les recommandations sont générées par l'interaction entre les représentations de l'utilisateur et de l'article cible. Le modèle est optimisé à l'aide d'une fonction de perte d'entropie croisée binaire. Les expériences menées sur l'ensemble de données Amazon Books valident les performances supérieures du modèle proposé sur diverses métriques d'évaluation, et le modèle montre également une bonne convergence et stabilité.

Contexte de Recherche et Motivation

Description du Problème

À l'ère de l'explosion informationnelle, les utilisateurs font face à une surcharge d'informations sans précédent. Les méthodes de recommandation traditionnelles telles que le filtrage collaboratif et les approches basées sur le contenu présentent des limitations significatives dans le traitement de la parcimonie, de la dimensionnalité élevée et des problèmes de démarrage à froid.

Importance de la Recherche

Les systèmes de recommandation jouent un rôle crucial sur les plateformes de commerce électronique, les plateformes vidéo et les réseaux sociaux. Avec le développement rapide de l'apprentissage profond et des grands modèles de langage, les systèmes de recommandation évoluent vers des architectures plus intelligentes et complexes. L'intégration de connaissances externes pour améliorer les performances de recommandation est devenue un point focal de recherche clé.

Limitations des Méthodes Existantes

Intégration insuffisante du graphe de connaissances : L'intégration seule du graphe de connaissances ne suffit pas à libérer pleinement son potentiel dans les systèmes de recommandation
Distinction insuffisante de l'importance des relations : Toutes les connexions ne contribuent pas de manière égale au processus de recommandation ; certains chemins d'association portent des informations plus significatives que d'autres
Manque d'explicabilité : Les utilisateurs ont besoin non seulement de recommandations de haute qualité, mais aussi de transparence et d'explications des raisons des recommandations

Motivation de la Recherche

Concevoir un modèle de recommandation explicable combinant le graphe de connaissances et un mécanisme d'attention consciente de la structure est à la fois une nécessité pratique et une étape naturelle de l'évolution intelligente des systèmes de recommandation. Cette recherche contribue au développement de systèmes de recommandation plus complets, efficaces et fiables.

Contributions Principales

Proposition d'une nouvelle architecture de recommandation explicable : Première intégration profonde du mécanisme d'attention consciente de la structure avec le graphe de connaissances, réalisant une double amélioration de la précision et de l'explicabilité
Conception d'une stratégie d'agrégation de voisins multi-sauts : Capture efficace des chemins de relations de haute valeur dans le graphe de connaissances par l'attribution dynamique d'importance
Implémentation d'un cadre d'optimisation de bout en bout : Construction d'une structure graphique utilisateur-article unifiée, supportant la construction de chemins sémantiques multi-niveaux et l'extraction d'informations contextuelles
Validation de l'efficacité de la méthode : Réalisation d'améliorations significatives de performance sur l'ensemble de données Amazon Books, surpassant les méthodes de base existantes sur tous les indicateurs d'évaluation

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné un ensemble d'utilisateurs U, un ensemble d'articles I, un ensemble d'entités E et un ensemble de relations R dans le graphe de connaissances, l'objectif est de prédire le score de préférence de l'utilisateur u pour l'article i et de fournir des chemins de recommandation explicables. Chaque triplet est représenté comme (h,r,t) ∈ E×R×E, où h représente l'entité de tête, r représente le type de relation et t représente l'entité de queue.

Architecture du Modèle

1. Construction de la Structure Graphique

Mappage des utilisateurs et des articles aux nœuds dans la structure graphique
Connexion de diverses entités auxiliaires (catégories, attributs, marques, etc.) par le biais du graphe de connaissances
Construction d'informations de voisins multi-sauts pour former des associations sémantiques riches

2. Mécanisme d'Attention Consciente de la Structure

Pour l'ensemble de nœuds voisins N(i) du nœud i, calculer le poids d'attention α_ij pour chaque nœud voisin j∈N(i) :

α_ij = exp(LeakyRELU(a^T[Wh_i||Wh_j])) / Σ_{k∈N(i)} exp(LeakyRELU(a^T[Wh_i||Wh_k]))

Où :

h_i représente la représentation d'intégration initiale du nœud i
W est une matrice de poids apprenable
a est le vecteur d'attention
|| représente l'opération de concaténation de vecteurs

3. Agrégation d'Informations et Apprentissage de Représentation

Agrégation des informations des voisins par les poids d'attention, construction de représentations d'intégration conjointes des utilisateurs et des articles. Les représentations de l'utilisateur u et de l'article i sont respectivement e_u et e_i, et la fonction de score finale adopte une forme de produit interne :

y_ui = e_u^T · e_i

4. Conception de la Fonction de Perte

Utilisation de l'entropie croisée binaire pour l'entraînement :

L = -Σ_{(u,i)∈D} [y_ui log y'_ui + (1-y_ui) log(1-y'_ui)]

Où D représente l'ensemble de données d'entraînement et y_ui ∈ {0,1} est la valeur d'étiquette indiquant si l'utilisateur u a interagi avec l'article i.

Points d'Innovation Technique

Attribution dynamique d'importance : Apprentissage automatique du degré d'influence de différents voisins sur le nœud central par le biais du mécanisme d'attention consciente de la structure
Chemins sémantiques multi-niveaux : Construction de chemins sémantiques multi-niveaux reliant l'utilisateur et l'article cible basée sur le graphe de connaissances
Explicabilité de bout en bout : Non seulement amélioration de la précision des recommandations, mais aussi fourniture d'explications de recommandation par le biais de chemins traçables

Configuration Expérimentale

Ensemble de Données

Utilisation de l'ensemble de données Amazon Books comme base expérimentale :

Source de données : Enregistrements réels d'interactions utilisateur d'une plateforme de commerce électronique en ligne
Contenu des données : Incluant les évaluations, les horodatages des commentaires et les métadonnées des produits
Informations du graphe de connaissances : Catégories de produits, marques, auteurs et autres entités et relations
Prétraitement : Suppression des enregistrements anormaux et des entités peu fréquentes, conservation uniquement des échantillons de rétroaction positive avec une évaluation de 4 et plus

Métriques d'Évaluation

Precision@10 : Proportion d'articles pertinents parmi les 10 premiers recommandés
Recall@10 : Proportion d'articles pertinents rappelés parmi les 10 premiers par rapport au total des articles pertinents
NDCG@10 : Gain cumulatif actualisé normalisé tenant compte de la position de classement
MAP : Valeur moyenne de la précision moyenne

Méthodes de Comparaison

SGCN-SRec : Recommandation sociale basée sur réseau de convolution graphique sensible aux sentiments
SA-MPF : Cadre de prédiction masquée conscient de l'état
Csrec : Recommandation séquentielle d'une perspective causale
DNS-Rec : Recommandation de recherche d'architecture neurale consciente des données
SAQ-Rec : Recommandation d'alignement de satisfaction utilisateur basée sur les retours de questionnaire
Sim-Rec : Recommandation séquentielle de démarrage à froid intégrant la similarité d'articles
Linrec : Mécanisme d'attention linéaire pour la recommandation de séquences longues

Détails d'Implémentation

Plage de taux d'apprentissage : 0,001-0,004
Nombre d'epochs d'entraînement : 100+ epochs
Algorithme d'optimisation : Descente de gradient utilisant la perte d'entropie croisée binaire

Résultats Expérimentaux

Résultats Principaux

Méthode	Precision@10	Recall@10	NDCG@10	MAP
SGCN-SRec	0,284	0,395	0,362	0,219
SA-MPF	0,301	0,411	0,374	0,231
Csrec	0,292	0,403	0,368	0,225
DNS-Rec	0,307	0,417	0,381	0,239
SAQ-Rec	0,315	0,426	0,388	0,247
Sim-Rec	0,298	0,407	0,370	0,228
Linrec	0,293	0,382	0,347	0,207
Notre Méthode	0,332	0,443	0,403	0,261

Conclusions Clés :

Réalisation des meilleures performances sur tous les indicateurs d'évaluation
Precision@10 atteint 0,332, Recall@10 atteint 0,443, surpassant significativement les méthodes de base
NDCG@10 de 0,403 et MAP de 0,261, démontrant une qualité de classement excellente

Analyse de Sensibilité des Hyperparamètres

Taux d'Apprentissage	Precision@10	Recall@10	NDCG@10	MAP
0,004	0,301	0,418	0,376	0,234
0,003	0,319	0,434	0,392	0,249
0,002	0,327	0,440	0,399	0,256
0,001	0,332	0,443	0,403	0,261

Résultats de l'Analyse :

Le taux d'apprentissage a un impact significatif sur les performances du modèle
Un taux d'apprentissage plus élevé (0,004) entraîne une instabilité d'entraînement
Le taux d'apprentissage optimal est 0,001, auquel le modèle atteint les performances optimales

Analyse de Convergence

Selon le graphique de décroissance de la fonction de perte :

Décroissance rapide de la perte au cours des 50 premiers epochs, capture rapide des caractéristiques fondamentales par le modèle
Courbe de perte progressivement aplanie dans les phases d'entraînement ultérieures, réduction significative des fluctuations
Réduction et stabilisation de l'écart entre la perte d'entraînement et la perte de validation, indiquant une bonne convergence du modèle et l'absence de surapprentissage

Travaux Connexes

Directions de Recherche Principales

Recommandation par réseaux de neurones graphiques : Utilisation des GNN pour capturer les structures de relations complexes et les associations sémantiques
Recommandation améliorée par graphe de connaissances : Utilisation de connaissances externes pour atténuer la parcimonie et les problèmes de démarrage à froid
Mécanisme d'attention : Attribution dynamique des poids d'importance à différentes informations
Recommandation explicable : Fourniture de transparence et de compréhensibilité des décisions de recommandation

Avantages de Cet Article par Rapport aux Travaux Connexes

Intégration innovante : Première fusion profonde de l'attention consciente de la structure avec le graphe de connaissances
Optimisation de bout en bout : Conception d'architecture unifiée supportant l'entraînement conjoint
Double objectif : Optimisation simultanée de la précision et de l'explicabilité
Validation empirique : Vérification de l'efficacité de la méthode sur des ensembles de données réels

Conclusion et Discussion

Conclusions Principales

Le mécanisme d'attention consciente de la structure peut identifier efficacement les relations de haute valeur dans le graphe de connaissances
La stratégie d'agrégation de voisins multi-sauts améliore significativement la capacité de capture des informations sémantiques
La méthode proposée réalise des améliorations significatives en termes de précision et d'explicabilité
Le modèle démontre une bonne convergence et une bonne capacité de généralisation

Limitations

Complexité de calcul : L'agrégation de voisins multi-sauts et le calcul d'attention augmentent la complexité du modèle
Dépendance aux données : Les performances du modèle dépendent de la qualité et de l'exhaustivité du graphe de connaissances
Scalabilité : L'extensibilité sur les structures graphiques à grande échelle nécessite une vérification supplémentaire
Adaptabilité dynamique : Capacité limitée d'adaptation aux préférences utilisateur changeantes dynamiquement

Directions Futures

Modélisation de graphes dynamiques : Exploration de l'impact de l'évolution structurelle sur la modélisation des intérêts utilisateur
Intégration de l'inférence causale : Combinaison de mécanismes d'inférence causale pour améliorer l'adaptabilité des stratégies de recommandation
Fusion d'apprentissage par renforcement : Amélioration de la capacité d'auto-adaptation des stratégies de recommandation dans les scénarios multi-objectifs
Transfert inter-domaines : Étude de la capacité de transfert du modèle entre différents domaines

Évaluation Approfondie

Points Forts

Forte innovativité technique : La fusion profonde de l'attention consciente de la structure avec le graphe de connaissances présente une nouveauté
Conception expérimentale complète : Incluant des expériences de comparaison complètes, une analyse des hyperparamètres et une vérification de convergence
Amélioration significative des performances : Améliorations évidentes sur tous les indicateurs d'évaluation
Valeur pratique élevée : Applicable à plusieurs scénarios de recommandation tels que le commerce électronique et les réseaux sociaux
Forte explicabilité : Fourniture d'explications de recommandation par le biais de chemins sémantiques, renforçant la confiance des utilisateurs

Insuffisances

Analyse insuffisante des frais de calcul : Manque d'analyse détaillée de la complexité temporelle et spatiale
Ensemble de données unique : Vérification uniquement sur l'ensemble de données Amazon Books, la généralisation nécessite une vérification supplémentaire
Absence d'expériences d'ablation : Manque d'expériences d'ablation détaillées pour analyser les contributions spécifiques de chaque composant
Évaluation insuffisante de l'explicabilité : Manque d'évaluation quantitative de la qualité des explications générées
Sélection des méthodes de comparaison : Certaines méthodes de base sont relativement anciennes, manque de comparaison avec les méthodes SOTA les plus récentes

Impact

Contribution académique : Fourniture d'une nouvelle voie technique pour la recommandation améliorée par graphe de connaissances
Valeur pratique : La méthode possède une bonne faisabilité d'implémentation d'ingénierie
Signification inspirante : Fourniture d'un exemple pour l'application de l'attention consciente de la structure dans les systèmes de recommandation
Potentiel de développement : Établissement d'une base pour la recherche future sur la recommandation explicable

Scénarios Applicables

Recommandation de commerce électronique : Informations structurées riches telles que les catégories et les marques de produits
Recommandation de contenu : Modélisation des relations de sujet et d'auteur pour les actualités, vidéos, etc.
Recommandation sociale : Modélisation conjointe du réseau social utilisateur et du graphe d'intérêts
Recommandation intensive en connaissances : Scénarios nécessitant une compréhension sémantique profonde tels que les articles académiques et les documents professionnels

Références

L'article cite 31 articles connexes, couvrant plusieurs domaines tels que les systèmes de recommandation, les réseaux de neurones graphiques, les graphes de connaissances et les mécanismes d'attention, fournissant une base théorique solide et un soutien technique pour la recherche.

Évaluation Générale : Cet article démontre des performances excellentes en termes d'innovation technique et de vérification expérimentale, apportant une contribution précieuse au développement des systèmes de recommandation explicables. Bien qu'il présente certaines limitations, ses idées principales et ses méthodes techniques possèdent une valeur académique importante et une signification pratique, justifiant une recherche et une promotion d'application approfondies.