2025-11-14T19:31:12.107456

Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems

Lyu, Wang, Zhang et al.
This paper designs and implements an explainable recommendation model that integrates knowledge graphs with structure-aware attention mechanisms. The model is built on graph neural networks and incorporates a multi-hop neighbor aggregation strategy. By integrating the structural information of knowledge graphs and dynamically assigning importance to different neighbors through an attention mechanism, the model enhances its ability to capture implicit preference relationships. In the proposed method, users and items are embedded into a unified graph structure. Multi-level semantic paths are constructed based on entities and relations in the knowledge graph to extract richer contextual information. During the rating prediction phase, recommendations are generated through the interaction between user and target item representations. The model is optimized using a binary cross-entropy loss function. Experiments conducted on the Amazon Books dataset validate the superior performance of the proposed model across various evaluation metrics. The model also shows good convergence and stability. These results further demonstrate the effectiveness and practicality of structure-aware attention mechanisms in knowledge graph-enhanced recommendation.
academic

Integración de Atención Consciente de la Estructura y Grafos de Conocimiento en Sistemas de Recomendación Explicables

Información Básica

  • ID del Artículo: 2510.10109
  • Título: Integración de Atención Consciente de la Estructura y Grafos de Conocimiento en Sistemas de Recomendación Explicables
  • Autores: Shuangquan Lyu (Carnegie Mellon University), Ming Wang (Trine University), Huajun Zhang (Syracuse University), Xiaoxuan Sun (Independent Researcher), Junjiang Lin (University of Toronto), Jiasen Zheng (Northwestern University)
  • Clasificación: cs.IR (Recuperación de Información)
  • Fecha de Publicación/Conferencia: Preimpresión de 2024
  • Enlace del Artículo: https://arxiv.org/abs/2510.10109

Resumen

Este artículo diseña e implementa un modelo de recomendación explicable que integra grafos de conocimiento con mecanismos de atención consciente de la estructura. El modelo se construye sobre redes neuronales de grafos y adopta una estrategia de agregación de vecinos de múltiples saltos. Al integrar información estructural de grafos de conocimiento y asignar dinámicamente la importancia de diferentes vecinos mediante mecanismos de atención, el modelo mejora la capacidad de capturar relaciones de preferencia implícitas. En el método propuesto, los usuarios y elementos se incrustan en una estructura de grafo unificada, construyendo rutas semánticas multinivel basadas en entidades y relaciones en el grafo de conocimiento para extraer información contextual más rica. En la fase de predicción de calificaciones, se generan recomendaciones mediante la interacción entre representaciones de usuarios y elementos objetivo. El modelo se optimiza utilizando una función de pérdida de entropía cruzada binaria. Los experimentos realizados en el conjunto de datos Amazon Books validan el desempeño superior del modelo propuesto en varias métricas de evaluación, demostrando también buena convergencia y estabilidad.

Antecedentes de Investigación y Motivación

Descripción del Problema

En la era de la explosión de información, los usuarios enfrentan un problema sin precedentes de sobrecarga informativa. Los métodos de recomendación tradicionales como el filtrado colaborativo y los métodos basados en contenido presentan limitaciones significativas al abordar problemas de dispersión, alta dimensionalidad e inicio en frío.

Importancia de la Investigación

Los sistemas de recomendación desempeñan un papel crítico en plataformas de comercio electrónico, plataformas de video y redes sociales. Con el rápido desarrollo del aprendizaje profundo y los grandes modelos de lenguaje, los sistemas de recomendación están evolucionando hacia arquitecturas más inteligentes y complejas. La integración de conocimiento externo para mejorar el desempeño de recomendación se ha convertido en un enfoque de investigación clave.

Limitaciones de los Métodos Existentes

  1. Integración Insuficiente de Grafos de Conocimiento: Simplemente integrar grafos de conocimiento no es suficiente para liberar completamente su potencial en sistemas de recomendación
  2. Distinción Insuficiente de Importancia de Relaciones: No todas las conexiones contribuyen por igual al proceso de recomendación; ciertas rutas de asociación transportan información más significativa que otras
  3. Falta de Explicabilidad: Los usuarios no solo necesitan recomendaciones de alta calidad, sino también transparencia y explicaciones de las razones de las recomendaciones

Motivación de la Investigación

Diseñar un modelo de recomendación explicable que combine grafos de conocimiento y mecanismos de atención consciente de la estructura es tanto una necesidad práctica como un paso natural en la evolución inteligente de los sistemas de recomendación. Esta investigación contribuye al desarrollo de sistemas de recomendación más completos, eficientes y confiables.

Contribuciones Principales

  1. Propuesta de una Nueva Arquitectura de Recomendación Explicable: Primera integración profunda de mecanismos de atención consciente de la estructura con grafos de conocimiento, logrando una mejora dual en precisión y explicabilidad
  2. Diseño de una Estrategia de Agregación de Vecinos de Múltiples Saltos: Mediante asignación dinámica de importancia, captura efectivamente rutas de relaciones de alto valor en grafos de conocimiento
  3. Implementación de un Marco de Optimización de Extremo a Extremo: Construcción de una estructura de grafo usuario-elemento unificada que soporta construcción de rutas semánticas multinivel y extracción de información contextual
  4. Validación de la Efectividad del Método: Logro de mejoras de desempeño significativas en el conjunto de datos Amazon Books, superando métodos de referencia en todas las métricas de evaluación

Explicación Detallada del Método

Definición de la Tarea

Dado un conjunto de usuarios U, conjunto de elementos I, conjunto de entidades E en el grafo de conocimiento y conjunto de relaciones R, el objetivo es predecir la calificación de preferencia del usuario u hacia el elemento i y proporcionar rutas de recomendación explicables. Cada tripla se representa como (h,r,t) ∈ E×R×E, donde h denota la entidad cabeza, r denota el tipo de relación y t denota la entidad cola.

Arquitectura del Modelo

1. Construcción de la Estructura del Grafo

  • Mapeo de usuarios y elementos a nodos en la estructura del grafo
  • Conexión de varias entidades auxiliares (categorías, atributos, marcas, etc.) mediante el grafo de conocimiento
  • Construcción de información de vecinos de múltiples saltos para formar asociaciones semánticas ricas

2. Mecanismo de Atención Consciente de la Estructura

Para el conjunto de nodos vecinos N(i) del nodo i, se calcula el peso de atención α_ij para cada nodo vecino j∈N(i):

α_ij = exp(LeakyRELU(a^T[Wh_i||Wh_j])) / Σ_{k∈N(i)} exp(LeakyRELU(a^T[Wh_i||Wh_k]))

Donde:

  • h_i denota la representación de incrustación inicial del nodo i
  • W es una matriz de pesos aprendible
  • a es el vector de atención
  • || denota la operación de concatenación de vectores

3. Agregación de Información y Aprendizaje de Representación

Mediante la agregación de información de vecinos con pesos de atención, se construye una representación de incrustación conjunta de usuarios y elementos. Las representaciones del usuario u y elemento i son e_u y e_i respectivamente, y la función de calificación final adopta la forma de producto interno:

y_ui = e_u^T · e_i

4. Diseño de la Función de Pérdida

Se adopta entropía cruzada binaria para el entrenamiento:

L = -Σ_{(u,i)∈D} [y_ui log y'_ui + (1-y_ui) log(1-y'_ui)]

Donde D denota el conjunto de datos de entrenamiento, y y_ui ∈ {0,1} es el valor de etiqueta indicando si el usuario u interactuó con el elemento i.

Puntos de Innovación Técnica

  1. Asignación Dinámica de Importancia: Aprendizaje automático del grado de influencia de diferentes vecinos en el nodo central mediante mecanismos de atención consciente de la estructura
  2. Rutas Semánticas Multinivel: Construcción de rutas semánticas multinivel basadas en grafos de conocimiento que conectan usuarios y elementos objetivo
  3. Explicabilidad de Extremo a Extremo: No solo mejora la precisión de recomendación, sino que también proporciona explicaciones de recomendación basadas en rutas trazables

Configuración Experimental

Conjunto de Datos

Uso del conjunto de datos Amazon Books como base experimental:

  • Fuente de Datos: Registros reales de interacción de usuarios de plataformas de comercio electrónico en línea
  • Contenido de Datos: Incluye calificaciones, marcas de tiempo de reseñas y metadatos de productos
  • Información del Grafo de Conocimiento: Categorías de productos, marcas, autores y otras entidades y relaciones
  • Preprocesamiento: Eliminación de registros anómalos y entidades de baja frecuencia, retención solo de muestras de retroalimentación positiva de 4 puntos o superior

Métricas de Evaluación

  • Precisión@10: Proporción de elementos relevantes entre los 10 primeros recomendados
  • Recuperación@10: Proporción de elementos relevantes recuperados entre los 10 primeros sobre el total de elementos relevantes
  • NDCG@10: Ganancia Acumulada Descontada Normalizada considerando la posición de clasificación
  • MAP: Valor Medio de Precisión Promedio

Métodos de Comparación

  • SGCN-SRec: Recomendación social de red neuronal convolucional de grafo basada en sentimiento
  • SA-MPF: Marco de predicción de máscara consciente de estado
  • Csrec: Recomendación secuencial desde perspectiva causal
  • DNS-Rec: Recomendación de búsqueda de arquitectura neuronal consciente de datos
  • SAQ-Rec: Recomendación de alineación de satisfacción del usuario basada en retroalimentación de cuestionario
  • Sim-Rec: Recomendación secuencial de inicio en frío integrada con similitud de elementos
  • Linrec: Mecanismo de atención lineal para recomendación de secuencia a largo plazo

Detalles de Implementación

  • Rango de tasa de aprendizaje: 0.001-0.004
  • Épocas de entrenamiento: 100+ épocas
  • Algoritmo de optimización: Descenso de gradiente con pérdida de entropía cruzada binaria

Resultados Experimentales

Resultados Principales

MétodoPrecisión@10Recuperación@10NDCG@10MAP
SGCN-SRec0.2840.3950.3620.219
SA-MPF0.3010.4110.3740.231
Csrec0.2920.4030.3680.225
DNS-Rec0.3070.4170.3810.239
SAQ-Rec0.3150.4260.3880.247
Sim-Rec0.2980.4070.3700.228
Linrec0.2930.3820.3470.207
Nuestro0.3320.4430.4030.261

Hallazgos Clave:

  • Desempeño óptimo en todas las métricas de evaluación
  • Precisión@10 alcanza 0.332, Recuperación@10 alcanza 0.443, superando significativamente los métodos de referencia
  • NDCG@10 es 0.403, MAP es 0.261, demostrando excelente calidad de clasificación

Análisis de Sensibilidad de Hiperparámetros

Tasa de AprendizajePrecisión@10Recuperación@10NDCG@10MAP
0.0040.3010.4180.3760.234
0.0030.3190.4340.3920.249
0.0020.3270.4400.3990.256
0.0010.3320.4430.4030.261

Resultados del Análisis:

  • La tasa de aprendizaje tiene un impacto significativo en el desempeño del modelo
  • Tasas de aprendizaje más altas (0.004) conducen a inestabilidad en el entrenamiento
  • La tasa de aprendizaje óptima es 0.001, donde el modelo alcanza desempeño óptimo

Análisis de Convergencia

Según el gráfico de descenso de la función de pérdida:

  • En las primeras 50 épocas de entrenamiento, la pérdida desciende rápidamente, capturando rápidamente características básicas
  • En el entrenamiento posterior, la curva de pérdida se aplana gradualmente, con amplitud de fluctuación significativamente reducida
  • La brecha entre pérdida de entrenamiento y pérdida de validación se reduce y se estabiliza, indicando buena convergencia del modelo sin sobreajuste

Trabajo Relacionado

Direcciones Principales de Investigación

  1. Recomendación con Redes Neuronales de Grafos: Utilización de GNN para capturar estructuras de relaciones complejas y asociaciones semánticas
  2. Recomendación Mejorada con Grafos de Conocimiento: Mitigación de dispersión y problemas de inicio en frío mediante conocimiento externo
  3. Mecanismos de Atención: Asignación dinámica de pesos de importancia a diferentes informaciones
  4. Recomendación Explicable: Provisión de transparencia y comprensibilidad en decisiones de recomendación

Ventajas del Presente Trabajo Comparado con Trabajo Relacionado

  1. Integración Innovadora: Primera fusión profunda de atención consciente de la estructura con grafos de conocimiento
  2. Optimización de Extremo a Extremo: Diseño de arquitectura unificada que soporta entrenamiento conjunto
  3. Objetivos Duales: Optimización simultánea de precisión y explicabilidad
  4. Validación Empírica: Verificación de efectividad del método en conjuntos de datos reales

Conclusiones y Discusión

Conclusiones Principales

  1. El mecanismo de atención consciente de la estructura puede identificar efectivamente relaciones de alto valor en grafos de conocimiento
  2. La estrategia de agregación de vecinos de múltiples saltos mejora significativamente la capacidad de captura de información semántica
  3. El método propuesto logra mejoras significativas tanto en precisión como en explicabilidad
  4. El modelo demuestra buena convergencia y capacidad de generalización

Limitaciones

  1. Complejidad Computacional: La agregación de vecinos de múltiples saltos y el cálculo de atención aumentan la complejidad del modelo
  2. Dependencia de Datos: El desempeño del modelo depende de la calidad e integridad del grafo de conocimiento
  3. Escalabilidad: La extensibilidad en estructuras de grafos a gran escala requiere verificación adicional
  4. Adaptabilidad Dinámica: Capacidad limitada de adaptación a preferencias de usuario que cambian dinámicamente

Direcciones Futuras

  1. Modelado de Grafos Dinámicos: Exploración del impacto de la evolución estructural en el modelado de intereses de usuarios
  2. Integración de Razonamiento Causal: Combinación de mecanismos de razonamiento causal para mejorar la adaptabilidad de estrategias de recomendación
  3. Fusión de Aprendizaje por Refuerzo: Mejora de la capacidad de autoadaptación de estrategias de recomendación en escenarios multiobjetivo
  4. Transferencia Entre Dominios: Investigación de capacidades de transferencia del modelo entre diferentes dominios

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación Técnica: La fusión profunda de atención consciente de la estructura con grafos de conocimiento posee novedad
  2. Diseño Experimental Completo: Incluye experimentos comparativos exhaustivos, análisis de hiperparámetros y verificación de convergencia
  3. Mejora de Desempeño Significativa: Logra mejoras evidentes en todas las métricas de evaluación
  4. Alto Valor Práctico: Aplicable a múltiples escenarios de recomendación como comercio electrónico y redes sociales
  5. Fuerte Explicabilidad: Proporciona explicaciones de recomendación mediante rutas semánticas, aumentando la confianza del usuario

Deficiencias

  1. Análisis Insuficiente de Costo Computacional: Falta análisis detallado de complejidad temporal y espacial
  2. Conjunto de Datos Único: Validación solo en conjunto de datos Amazon Books, generalización requiere verificación adicional
  3. Falta de Experimentos de Ablación: Ausencia de experimentos de ablación detallados para analizar contribuciones de componentes individuales
  4. Evaluación de Explicabilidad: Falta evaluación cuantitativa de la calidad de explicaciones generadas
  5. Selección de Métodos de Comparación: Algunos métodos de referencia son relativamente antiguos, falta comparación con métodos SOTA recientes

Impacto

  1. Contribución Académica: Proporciona una nueva ruta técnica para recomendación mejorada con grafos de conocimiento
  2. Valor Práctico: El método posee buena viabilidad de implementación de ingeniería
  3. Significado Inspirador: Proporciona ejemplos de aplicación de atención consciente de la estructura en sistemas de recomendación
  4. Potencial de Desarrollo: Sienta las bases para investigación futura en recomendación explicable

Escenarios Aplicables

  1. Recomendación de Comercio Electrónico: Información estructurada rica en recomendación de productos como categorías y marcas
  2. Recomendación de Contenido: Modelado de relaciones de tema y autor en noticias, video y otros contenidos
  3. Recomendación Social: Modelado conjunto de redes sociales de usuarios y grafos de intereses
  4. Recomendación Intensiva en Conocimiento: Escenarios como artículos académicos y documentos profesionales que requieren comprensión semántica profunda

Referencias

El artículo cita 31 referencias relacionadas, abarcando múltiples campos incluyendo sistemas de recomendación, redes neuronales de grafos, grafos de conocimiento y mecanismos de atención, proporcionando una base teórica sólida y apoyo técnico para la investigación.


Evaluación General: Este artículo demuestra un desempeño excelente en innovación técnica y verificación experimental, realizando una contribución valiosa al desarrollo de sistemas de recomendación explicables. Aunque existen algunas limitaciones, sus ideas centrales y métodos técnicos poseen importante valor académico y significado práctico, mereciendo investigación y promoción de aplicación más profundas.