2025-11-14T19:31:12.107456

Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems

Lyu, Wang, Zhang et al.

This paper designs and implements an explainable recommendation model that integrates knowledge graphs with structure-aware attention mechanisms. The model is built on graph neural networks and incorporates a multi-hop neighbor aggregation strategy. By integrating the structural information of knowledge graphs and dynamically assigning importance to different neighbors through an attention mechanism, the model enhances its ability to capture implicit preference relationships. In the proposed method, users and items are embedded into a unified graph structure. Multi-level semantic paths are constructed based on entities and relations in the knowledge graph to extract richer contextual information. During the rating prediction phase, recommendations are generated through the interaction between user and target item representations. The model is optimized using a binary cross-entropy loss function. Experiments conducted on the Amazon Books dataset validate the superior performance of the proposed model across various evaluation metrics. The model also shows good convergence and stability. These results further demonstrate the effectiveness and practicality of structure-aware attention mechanisms in knowledge graph-enhanced recommendation.

academic

Integración de Atención Consciente de la Estructura y Grafos de Conocimiento en Sistemas de Recomendación Explicables

Información Básica

ID del Artículo: 2510.10109
Título: Integración de Atención Consciente de la Estructura y Grafos de Conocimiento en Sistemas de Recomendación Explicables
Autores: Shuangquan Lyu (Carnegie Mellon University), Ming Wang (Trine University), Huajun Zhang (Syracuse University), Xiaoxuan Sun (Independent Researcher), Junjiang Lin (University of Toronto), Jiasen Zheng (Northwestern University)
Clasificación: cs.IR (Recuperación de Información)
Fecha de Publicación/Conferencia: Preimpresión de 2024
Enlace del Artículo: https://arxiv.org/abs/2510.10109

Resumen

Este artículo diseña e implementa un modelo de recomendación explicable que integra grafos de conocimiento con mecanismos de atención consciente de la estructura. El modelo se construye sobre redes neuronales de grafos y adopta una estrategia de agregación de vecinos de múltiples saltos. Al integrar información estructural de grafos de conocimiento y asignar dinámicamente la importancia de diferentes vecinos mediante mecanismos de atención, el modelo mejora la capacidad de capturar relaciones de preferencia implícitas. En el método propuesto, los usuarios y elementos se incrustan en una estructura de grafo unificada, construyendo rutas semánticas multinivel basadas en entidades y relaciones en el grafo de conocimiento para extraer información contextual más rica. En la fase de predicción de calificaciones, se generan recomendaciones mediante la interacción entre representaciones de usuarios y elementos objetivo. El modelo se optimiza utilizando una función de pérdida de entropía cruzada binaria. Los experimentos realizados en el conjunto de datos Amazon Books validan el desempeño superior del modelo propuesto en varias métricas de evaluación, demostrando también buena convergencia y estabilidad.

Antecedentes de Investigación y Motivación

Descripción del Problema

En la era de la explosión de información, los usuarios enfrentan un problema sin precedentes de sobrecarga informativa. Los métodos de recomendación tradicionales como el filtrado colaborativo y los métodos basados en contenido presentan limitaciones significativas al abordar problemas de dispersión, alta dimensionalidad e inicio en frío.

Importancia de la Investigación

Los sistemas de recomendación desempeñan un papel crítico en plataformas de comercio electrónico, plataformas de video y redes sociales. Con el rápido desarrollo del aprendizaje profundo y los grandes modelos de lenguaje, los sistemas de recomendación están evolucionando hacia arquitecturas más inteligentes y complejas. La integración de conocimiento externo para mejorar el desempeño de recomendación se ha convertido en un enfoque de investigación clave.

Limitaciones de los Métodos Existentes

Integración Insuficiente de Grafos de Conocimiento: Simplemente integrar grafos de conocimiento no es suficiente para liberar completamente su potencial en sistemas de recomendación
Distinción Insuficiente de Importancia de Relaciones: No todas las conexiones contribuyen por igual al proceso de recomendación; ciertas rutas de asociación transportan información más significativa que otras
Falta de Explicabilidad: Los usuarios no solo necesitan recomendaciones de alta calidad, sino también transparencia y explicaciones de las razones de las recomendaciones

Motivación de la Investigación

Diseñar un modelo de recomendación explicable que combine grafos de conocimiento y mecanismos de atención consciente de la estructura es tanto una necesidad práctica como un paso natural en la evolución inteligente de los sistemas de recomendación. Esta investigación contribuye al desarrollo de sistemas de recomendación más completos, eficientes y confiables.

Contribuciones Principales

Propuesta de una Nueva Arquitectura de Recomendación Explicable: Primera integración profunda de mecanismos de atención consciente de la estructura con grafos de conocimiento, logrando una mejora dual en precisión y explicabilidad
Diseño de una Estrategia de Agregación de Vecinos de Múltiples Saltos: Mediante asignación dinámica de importancia, captura efectivamente rutas de relaciones de alto valor en grafos de conocimiento
Implementación de un Marco de Optimización de Extremo a Extremo: Construcción de una estructura de grafo usuario-elemento unificada que soporta construcción de rutas semánticas multinivel y extracción de información contextual
Validación de la Efectividad del Método: Logro de mejoras de desempeño significativas en el conjunto de datos Amazon Books, superando métodos de referencia en todas las métricas de evaluación

Explicación Detallada del Método

Definición de la Tarea

Dado un conjunto de usuarios U, conjunto de elementos I, conjunto de entidades E en el grafo de conocimiento y conjunto de relaciones R, el objetivo es predecir la calificación de preferencia del usuario u hacia el elemento i y proporcionar rutas de recomendación explicables. Cada tripla se representa como (h,r,t) ∈ E×R×E, donde h denota la entidad cabeza, r denota el tipo de relación y t denota la entidad cola.

Arquitectura del Modelo

1. Construcción de la Estructura del Grafo

Mapeo de usuarios y elementos a nodos en la estructura del grafo
Conexión de varias entidades auxiliares (categorías, atributos, marcas, etc.) mediante el grafo de conocimiento
Construcción de información de vecinos de múltiples saltos para formar asociaciones semánticas ricas

2. Mecanismo de Atención Consciente de la Estructura

Para el conjunto de nodos vecinos N(i) del nodo i, se calcula el peso de atención α_ij para cada nodo vecino j∈N(i):

α_ij = exp(LeakyRELU(a^T[Wh_i||Wh_j])) / Σ_{k∈N(i)} exp(LeakyRELU(a^T[Wh_i||Wh_k]))

Donde:

h_i denota la representación de incrustación inicial del nodo i
W es una matriz de pesos aprendible
a es el vector de atención
|| denota la operación de concatenación de vectores

3. Agregación de Información y Aprendizaje de Representación

Mediante la agregación de información de vecinos con pesos de atención, se construye una representación de incrustación conjunta de usuarios y elementos. Las representaciones del usuario u y elemento i son e_u y e_i respectivamente, y la función de calificación final adopta la forma de producto interno:

y_ui = e_u^T · e_i

4. Diseño de la Función de Pérdida

Se adopta entropía cruzada binaria para el entrenamiento:

L = -Σ_{(u,i)∈D} [y_ui log y'_ui + (1-y_ui) log(1-y'_ui)]

Donde D denota el conjunto de datos de entrenamiento, y y_ui ∈ {0,1} es el valor de etiqueta indicando si el usuario u interactuó con el elemento i.

Puntos de Innovación Técnica

Asignación Dinámica de Importancia: Aprendizaje automático del grado de influencia de diferentes vecinos en el nodo central mediante mecanismos de atención consciente de la estructura
Rutas Semánticas Multinivel: Construcción de rutas semánticas multinivel basadas en grafos de conocimiento que conectan usuarios y elementos objetivo
Explicabilidad de Extremo a Extremo: No solo mejora la precisión de recomendación, sino que también proporciona explicaciones de recomendación basadas en rutas trazables

Configuración Experimental

Conjunto de Datos

Uso del conjunto de datos Amazon Books como base experimental:

Fuente de Datos: Registros reales de interacción de usuarios de plataformas de comercio electrónico en línea
Contenido de Datos: Incluye calificaciones, marcas de tiempo de reseñas y metadatos de productos
Información del Grafo de Conocimiento: Categorías de productos, marcas, autores y otras entidades y relaciones
Preprocesamiento: Eliminación de registros anómalos y entidades de baja frecuencia, retención solo de muestras de retroalimentación positiva de 4 puntos o superior

Métricas de Evaluación

Precisión@10: Proporción de elementos relevantes entre los 10 primeros recomendados
Recuperación@10: Proporción de elementos relevantes recuperados entre los 10 primeros sobre el total de elementos relevantes
NDCG@10: Ganancia Acumulada Descontada Normalizada considerando la posición de clasificación
MAP: Valor Medio de Precisión Promedio

Métodos de Comparación

SGCN-SRec: Recomendación social de red neuronal convolucional de grafo basada en sentimiento
SA-MPF: Marco de predicción de máscara consciente de estado
Csrec: Recomendación secuencial desde perspectiva causal
DNS-Rec: Recomendación de búsqueda de arquitectura neuronal consciente de datos
SAQ-Rec: Recomendación de alineación de satisfacción del usuario basada en retroalimentación de cuestionario
Sim-Rec: Recomendación secuencial de inicio en frío integrada con similitud de elementos
Linrec: Mecanismo de atención lineal para recomendación de secuencia a largo plazo

Detalles de Implementación

Rango de tasa de aprendizaje: 0.001-0.004
Épocas de entrenamiento: 100+ épocas
Algoritmo de optimización: Descenso de gradiente con pérdida de entropía cruzada binaria

Resultados Experimentales

Resultados Principales

Método	Precisión@10	Recuperación@10	NDCG@10	MAP
SGCN-SRec	0.284	0.395	0.362	0.219
SA-MPF	0.301	0.411	0.374	0.231
Csrec	0.292	0.403	0.368	0.225
DNS-Rec	0.307	0.417	0.381	0.239
SAQ-Rec	0.315	0.426	0.388	0.247
Sim-Rec	0.298	0.407	0.370	0.228
Linrec	0.293	0.382	0.347	0.207
Nuestro	0.332	0.443	0.403	0.261

Hallazgos Clave:

Desempeño óptimo en todas las métricas de evaluación
Precisión@10 alcanza 0.332, Recuperación@10 alcanza 0.443, superando significativamente los métodos de referencia
NDCG@10 es 0.403, MAP es 0.261, demostrando excelente calidad de clasificación

Análisis de Sensibilidad de Hiperparámetros

Tasa de Aprendizaje	Precisión@10	Recuperación@10	NDCG@10	MAP
0.004	0.301	0.418	0.376	0.234
0.003	0.319	0.434	0.392	0.249
0.002	0.327	0.440	0.399	0.256
0.001	0.332	0.443	0.403	0.261

Resultados del Análisis:

La tasa de aprendizaje tiene un impacto significativo en el desempeño del modelo
Tasas de aprendizaje más altas (0.004) conducen a inestabilidad en el entrenamiento
La tasa de aprendizaje óptima es 0.001, donde el modelo alcanza desempeño óptimo

Análisis de Convergencia

Según el gráfico de descenso de la función de pérdida:

En las primeras 50 épocas de entrenamiento, la pérdida desciende rápidamente, capturando rápidamente características básicas
En el entrenamiento posterior, la curva de pérdida se aplana gradualmente, con amplitud de fluctuación significativamente reducida
La brecha entre pérdida de entrenamiento y pérdida de validación se reduce y se estabiliza, indicando buena convergencia del modelo sin sobreajuste

Trabajo Relacionado

Direcciones Principales de Investigación

Recomendación con Redes Neuronales de Grafos: Utilización de GNN para capturar estructuras de relaciones complejas y asociaciones semánticas
Recomendación Mejorada con Grafos de Conocimiento: Mitigación de dispersión y problemas de inicio en frío mediante conocimiento externo
Mecanismos de Atención: Asignación dinámica de pesos de importancia a diferentes informaciones
Recomendación Explicable: Provisión de transparencia y comprensibilidad en decisiones de recomendación

Ventajas del Presente Trabajo Comparado con Trabajo Relacionado

Integración Innovadora: Primera fusión profunda de atención consciente de la estructura con grafos de conocimiento
Optimización de Extremo a Extremo: Diseño de arquitectura unificada que soporta entrenamiento conjunto
Objetivos Duales: Optimización simultánea de precisión y explicabilidad
Validación Empírica: Verificación de efectividad del método en conjuntos de datos reales

Conclusiones y Discusión

Conclusiones Principales

El mecanismo de atención consciente de la estructura puede identificar efectivamente relaciones de alto valor en grafos de conocimiento
La estrategia de agregación de vecinos de múltiples saltos mejora significativamente la capacidad de captura de información semántica
El método propuesto logra mejoras significativas tanto en precisión como en explicabilidad
El modelo demuestra buena convergencia y capacidad de generalización

Limitaciones

Complejidad Computacional: La agregación de vecinos de múltiples saltos y el cálculo de atención aumentan la complejidad del modelo
Dependencia de Datos: El desempeño del modelo depende de la calidad e integridad del grafo de conocimiento
Escalabilidad: La extensibilidad en estructuras de grafos a gran escala requiere verificación adicional
Adaptabilidad Dinámica: Capacidad limitada de adaptación a preferencias de usuario que cambian dinámicamente

Direcciones Futuras

Modelado de Grafos Dinámicos: Exploración del impacto de la evolución estructural en el modelado de intereses de usuarios
Integración de Razonamiento Causal: Combinación de mecanismos de razonamiento causal para mejorar la adaptabilidad de estrategias de recomendación
Fusión de Aprendizaje por Refuerzo: Mejora de la capacidad de autoadaptación de estrategias de recomendación en escenarios multiobjetivo
Transferencia Entre Dominios: Investigación de capacidades de transferencia del modelo entre diferentes dominios

Evaluación Profunda

Fortalezas

Fuerte Innovación Técnica: La fusión profunda de atención consciente de la estructura con grafos de conocimiento posee novedad
Diseño Experimental Completo: Incluye experimentos comparativos exhaustivos, análisis de hiperparámetros y verificación de convergencia
Mejora de Desempeño Significativa: Logra mejoras evidentes en todas las métricas de evaluación
Alto Valor Práctico: Aplicable a múltiples escenarios de recomendación como comercio electrónico y redes sociales
Fuerte Explicabilidad: Proporciona explicaciones de recomendación mediante rutas semánticas, aumentando la confianza del usuario

Deficiencias

Análisis Insuficiente de Costo Computacional: Falta análisis detallado de complejidad temporal y espacial
Conjunto de Datos Único: Validación solo en conjunto de datos Amazon Books, generalización requiere verificación adicional
Falta de Experimentos de Ablación: Ausencia de experimentos de ablación detallados para analizar contribuciones de componentes individuales
Evaluación de Explicabilidad: Falta evaluación cuantitativa de la calidad de explicaciones generadas
Selección de Métodos de Comparación: Algunos métodos de referencia son relativamente antiguos, falta comparación con métodos SOTA recientes

Impacto

Contribución Académica: Proporciona una nueva ruta técnica para recomendación mejorada con grafos de conocimiento
Valor Práctico: El método posee buena viabilidad de implementación de ingeniería
Significado Inspirador: Proporciona ejemplos de aplicación de atención consciente de la estructura en sistemas de recomendación
Potencial de Desarrollo: Sienta las bases para investigación futura en recomendación explicable

Escenarios Aplicables

Recomendación de Comercio Electrónico: Información estructurada rica en recomendación de productos como categorías y marcas
Recomendación de Contenido: Modelado de relaciones de tema y autor en noticias, video y otros contenidos
Recomendación Social: Modelado conjunto de redes sociales de usuarios y grafos de intereses
Recomendación Intensiva en Conocimiento: Escenarios como artículos académicos y documentos profesionales que requieren comprensión semántica profunda

Referencias

El artículo cita 31 referencias relacionadas, abarcando múltiples campos incluyendo sistemas de recomendación, redes neuronales de grafos, grafos de conocimiento y mecanismos de atención, proporcionando una base teórica sólida y apoyo técnico para la investigación.

Evaluación General: Este artículo demuestra un desempeño excelente en innovación técnica y verificación experimental, realizando una contribución valiosa al desarrollo de sistemas de recomendación explicables. Aunque existen algunas limitaciones, sus ideas centrales y métodos técnicos poseen importante valor académico y significado práctico, mereciendo investigación y promoción de aplicación más profundas.