2025-11-22T20:07:15.604385

Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion

Liu, Wen, Sun et al.

Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.

academic

Sintonización Semántica-Condicional: Fusionando Contexto de Grafos con Modelos de Lenguaje Grande para Completación de Grafos de Conocimiento

Información Básica

ID del Artículo: 2510.08966
Título: Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Autores: Ruitong Liu, Yan Wen, Te Sun, Yunjia Wu, Pingyang Huang, Zihang Yu, Siyuan Li
Clasificación: cs.AI cs.CL
Fecha de Publicación/Conferencia: The ACM Web Conference, 13-17 de abril de 2026, Dubái, Emiratos Árabes Unidos
Enlace del Artículo: https://arxiv.org/abs/2510.08966

Resumen

Este artículo propone Sintonización Semántica-Condicional (SCT), un nuevo paradigma de inyección de conocimiento para abordar el problema de fusión entre grafos de conocimiento y modelos de lenguaje grande en tareas de completación de grafos de conocimiento. Los métodos tradicionales de sintonización de prefijo simplemente concatenan incrustaciones de conocimiento con entrada de texto, una fusión superficial que ignora la rica semántica relacional en grafos de conocimiento e impone una carga de razonamiento implícito pesada en los LLM. SCT contiene dos módulos clave: el módulo de grafo semántico utiliza redes neuronales de grafos para extraer condiciones semánticas conscientes del contexto de vecindarios de grafos locales; el módulo de fusión adaptativa condicional modula adaptativamente incrustaciones de texto a través de dos proyectores parametrizados, logrando una interacción profunda, a nivel de características y consciente del conocimiento.

Antecedentes de Investigación y Motivación

Problemas Centrales

Incompletitud de Grafos de Conocimiento: Los grafos de conocimiento del mundo real son inherentemente incompletos, limitando su utilidad en aplicaciones posteriores
Limitaciones de la Fusión Superficial: Los métodos existentes de sintonización de prefijo solo realizan operaciones simples de concatenación, sin poder aprovechar plenamente la información estructural de los grafos de conocimiento
Dinamismo de la Semántica Relacional: El significado de las relaciones cambia dinámicamente según su contexto semántico circundante, como se muestra en la Figura 1 donde la relación "treats" representa diferentes mecanismos de tratamiento en diferentes contextos

Importancia de la Investigación

La completación de grafos de conocimiento es crucial para sistemas de recomendación, extracción de información, sistemas de preguntas y respuestas, entre otras aplicaciones
Los LLM carecen de conocimiento fáctico profundo y preciso, siendo propensos a problemas de alucinación
Es necesario fusionar efectivamente el conocimiento estructurado explícito de grafos de conocimiento con el conocimiento parametrizado implícito de los LLM

Limitaciones de Métodos Existentes

Superficialidad de la Sintonización de Prefijo: Las operaciones simples de concatenación no pueden lograr una integración profunda
Ignorancia de Semántica Relacional: No capturan la rica semántica relacional en grafos de conocimiento
Carga de Razonamiento: Imponen una carga de razonamiento implícito pesada en los LLM para asociar prefijos con texto

Contribuciones Principales

Propuesta del Marco SCT: Primer marco de sintonización semántica-condicional que integra conciencia contextual y fusión de incrustaciones adaptativa, superando las limitaciones de la simple concatenación de prefijos existente
Módulo de Grafo Semántico: Propone un novedoso mecanismo de paso de mensajes centrado en relaciones, donde la selección de vecinos está guiada por puntuaciones de similitud semántica explícita de descripciones de relaciones mejoradas con conocimiento
Módulo de Fusión Adaptativa Condicional: Introduce un mecanismo de fusión que utiliza condiciones semánticas para aprender transformaciones afines a nivel de características directas de incrustaciones de texto de entrada, logrando integración cooperativa profunda del contexto de grafo
Validación de Desempeño: Demuestra desempeño de última generación en múltiples puntos de referencia y alta eficiencia de parámetros

Explicación Detallada del Método

Definición de Tarea

El grafo de conocimiento G se define como un conjunto de tripletas T = {(h, r, t) | h, t ∈ E, r ∈ R}, donde E y R representan respectivamente los conjuntos de entidades y relaciones. La tarea de completación de grafo de conocimiento consiste en inferir elementos faltantes en tripletas dadas, como predecir la entidad cola t en la consulta (h, r, ?). En KGC basado en LLM, esta tarea se formaliza como un problema de generación de texto.

Arquitectura del Modelo

1. Módulo de Grafo Semántico (Semantic Graph Module)

Mejora del Conocimiento:

Utiliza un LLM potente (GPT-4O) para generar descripciones de texto canónicas para cada tipo de relación
Codifica las descripciones como vectores semánticos utilizando un modelo de incrustación de oraciones preentrenado (Sentence-BERT)

Paso de Mensajes Centrado en Relaciones:

Utiliza la estructura relacional del KG como grafo de cálculo principal
Los bordes (relaciones) actualizan su estado agregando información de bordes vecinos
Utiliza un mecanismo de selección Top-K para filtrar vecinos más semánticamente relevantes:

Score(ec, en) = (sc · sn) / (||sc||2 ||sn||2)

Actualización de Capas Transformer:

s^(l+1)_c = TransformerLayer(s^l_c, s̄_N_K(ec))

Generación de Condiciones Semánticas:

cS = MeanPool({s^L_h,i}_i ∪ {s^L_t,j}_j)

2. Módulo de Fusión Adaptativa Condicional (Condition-Adaptive Fusion Module)

Utiliza el mecanismo Feature-wise Linear Modulation (FiLM):

X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)

donde γ es el vector de escala y β es el vector de desplazamiento, logrando transformaciones afines a nivel de características en incrustaciones de texto.

Puntos de Innovación Técnica

Fusión Profunda vs Concatenación Superficial: A diferencia de la simple concatenación de prefijos, SCT logra interacción profunda a nivel de características
Selección de Vecinos Impulsada por Semántica: Utiliza descripciones de relaciones mejoradas con LLM para cálculo de similitud semántica, en lugar de representaciones aprendidas específicas de tareas
Procesamiento de Grafos Centrado en Relaciones: Se enfoca en relaciones en lugar de entidades, siendo más eficiente e indicativo semánticamente

Configuración Experimental

Conjuntos de Datos

Predicción de Enlaces:

WN18RR: 40,943 entidades, 11 relaciones, 86,835 tripletas de entrenamiento
FB15k-237: 14,541 entidades, 237 relaciones, 272,115 tripletas de entrenamiento

Clasificación de Tripletas:

UMLS: 135 entidades, 46 relaciones
CoDeX-S: 2,034 entidades, 42 relaciones
FB15k-237N: 13,104 entidades, 93 relaciones

Métricas de Evaluación

Predicción de Enlaces: Mean Reciprocal Rank (MRR) y Hits@N
Clasificación de Tripletas: Accuracy (Acc), Precision (P), Recall (R), F1-Score

Métodos de Comparación

Métodos de Incrustación: TransE, CompGCN, AdaProp, MA-GNN, etc. Métodos LLM: KICGPT, KG-FIT, MKGL, SSQR-LLaMA2, KoPA, etc.

Detalles de Implementación

Implementado basado en Alpaca-7B
Módulo de grafo semántico: 2 capas Transformer, Top-K=10
Sintonización de LLM utilizando LoRA (rank=64)
Optimizador AdamW, tamaño de lote 12
Estrategia de entrenamiento en dos etapas

Resultados Experimentales

Resultados Principales

Desempeño de Predicción de Enlaces:

Conjunto de datos WN18RR: Mejora de MRR del 2.2% en comparación con la línea base más fuerte SSQR-LLaMA2, Hits@1 del 2.4%, Hits@3 del 2.6%
Conjunto de datos FB15k-237: Mejora significativa de MRR del 4.9%, Hits@1 del 1.6%, Hits@10 del 4.4%

Desempeño de Clasificación de Tripletas:

Conjunto de datos UMLS: Precisión del 93.15%, puntuación F1 del 93.18%, logrando el mejor desempeño
Conjunto de datos FB15k-237N: Precisión del 78.02%, precisión del 71.10%, F1 del 80.93%, todos los mejores
Conjunto de datos CoDeX-S: Precisión máxima del 78.52%, otros indicadores comparables con líneas base fuertes

Experimentos de Ablación

Validación de Efectividad de Componentes:

sin Semántica: Reemplaza el módulo de grafo semántico con KGE tradicional
- En FB15k-237, MRR disminuye de 0.471 a 0.433, Hits@1 de 0.380 a 0.327
sin Fusión: Reemplaza el módulo de fusión adaptativa condicional con sintonización de prefijo
- La caída de desempeño es más severa, MRR y Hits@1 disminuyen 0.062 y 0.081 respectivamente

Comparación de Funciones de Puntuación:

La función de estilo RotatE muestra el mejor desempeño con MRR de 0.471
DistMult simple y MLP resultan en caídas de desempeño evidentes

Análisis de Casos

Efecto de Mejora Semántica: Para la consulta (Barack Obama, /government/politician/government_positions_held..., ?):

Sin Mejora de Conocimiento: Basado en superposición léxica, Gov Position (Title) etc. se clasifican más alto
Con Mejora de Conocimiento: Conceptos semánticamente relacionados como Person (Nationality) mejoran su clasificación, reflejando la transición de coincidencia de texto superficial a verdadera relevancia semántica

Sensibilidad de Hiperparámetros: El parámetro Top-K logra el mejor desempeño en K=10 (MRR=0.471, Hit@1=0.380), siendo K=4 demasiado pequeño (información insuficiente) y K=32 demasiado grande (introduce ruido).

Trabajo Relacionado

Completación de Grafos de Conocimiento

Métodos de Incrustación: Evolución desde modelos geométricos como TransE, ComplEx hacia métodos de espacios geométricos más complejos como RotE, HAKE
Métodos GNN: PathCon, CBLiP etc. agregan información de rutas de múltiples saltos, pero aún se basan en representaciones estáticas
Métodos LLM: KG-BERT, SimKGC etc. convierten tripletas en secuencias de texto, pero la interacción permanece en nivel superficial

Fusión de LLM y Grafos de Conocimiento

Dos direcciones principales:

Utilizar KG para proporcionar base fáctica a LLM, reduciendo alucinaciones
Aprovechar capacidades generativas y de razonamiento de LLM para resolver tareas relacionadas con KG

Limitación común de métodos existentes: La interacción con grafos de conocimiento frecuentemente permanece en nivel textual o superficial.

Conclusiones y Discusión

Conclusiones Principales

SCT supera significativamente métodos de sintonización de prefijo superficial mediante fusión profunda a nivel de características
El módulo de grafo semántico puede capturar efectivamente semántica relacional consciente del contexto
El módulo de fusión adaptativa condicional logra integración cooperativa profunda entre conocimiento y texto
Alcanza desempeño de última generación o altamente competitivo en múltiples puntos de referencia

Limitaciones

Profundidad de Razonamiento Limitada: La profundidad de razonamiento del marco actual aún tiene limitaciones
Adaptabilidad Insuficiente a Grafos Dinámicos: La adaptabilidad a grafos de conocimiento que cambian dinámicamente requiere mejora
Complejidad Computacional: El entrenamiento en dos etapas y mecanismos de fusión complejos aumentan el costo computacional

Direcciones Futuras

Generación de Condiciones Semánticas Jerárquicas: Introducir mecanismos jerárquicos para mejorar profundidad de razonamiento
Conciencia Temporal: Incorporar capacidad de conciencia temporal para manejar conocimiento dinámico
Expansión de Escenarios de Aplicación: Explorar aplicaciones en escenarios más complejos como grafos de conocimiento temporales

Evaluación Profunda

Fortalezas

Fuerte Innovación Metodológica: Primera propuesta de paradigma de fusión profunda a nivel de características, superando limitaciones de sintonización de prefijo tradicional
Diseño Técnico Razonable: El paso de mensajes centrado en relaciones y selección de vecinos impulsada por semántica están ingeniosamente diseñados
Experimentación Completa y Exhaustiva: Cubre dos categorías de tareas (predicción de enlaces y clasificación de tripletas), validadas en múltiples conjuntos de datos
Experimentos de Ablación Detallados: Valida sistemáticamente la contribución de cada componente
Análisis de Casos Profundo: Demuestra el efecto de mejora semántica mediante ejemplos concretos

Insuficiencias

Análisis de Complejidad Computacional Incompleto: No analiza detalladamente el costo computacional del entrenamiento en dos etapas
Discusión Limitada de Escalabilidad: El análisis de aplicabilidad a grafos de conocimiento de escala muy grande es insuficiente
Ausencia de Análisis de Errores: Falta análisis profundo de casos fallidos
Selección de Líneas Base: Algunos métodos de comparación podrían no ser los más recientes y fuertes

Impacto

Contribución Teórica: Proporciona un nuevo paradigma para fusión de grafos de conocimiento y LLM
Valor Práctico: El desempeño excepcional en múltiples puntos de referencia demuestra practicidad
Reproducibilidad: Proporciona detalles de implementación detallados que facilitan la reproducción
Inspiración: El enfoque de fusión a nivel de características puede inspirar investigaciones relacionadas

Escenarios Aplicables

Tareas Intensivas en Conocimiento: Particularmente adecuado para tareas de razonamiento que requieren conocimiento estructurado
Grafos de Conocimiento de Escala Media: Los resultados experimentales indican idoneidad para aplicaciones de KG de escala media
Escenarios con Altos Requisitos de Precisión: Desempeño destacado en aplicaciones donde la precisión es más importante que la eficiencia
Necesidades de Razonamiento Multi-Salto: Puede manejar efectivamente consultas complejas que requieren razonamiento multi-salto

Referencias

El artículo cita 80 referencias relacionadas, cubriendo múltiples campos incluyendo incrustación de grafos de conocimiento, redes neuronales de grafos, modelos de lenguaje grande, etc., proporcionando una base teórica sólida para la investigación. Las referencias clave incluyen métodos clásicos de incrustación de KG como TransE, RotatE, así como trabajos representativos de fusión LLM-KG como KG-BERT, KoPA.