Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
Sintonización Semántica-Condicional: Fusionando Contexto de Grafos con Modelos de Lenguaje Grande para Completación de Grafos de Conocimiento
Este artículo propone Sintonización Semántica-Condicional (SCT), un nuevo paradigma de inyección de conocimiento para abordar el problema de fusión entre grafos de conocimiento y modelos de lenguaje grande en tareas de completación de grafos de conocimiento. Los métodos tradicionales de sintonización de prefijo simplemente concatenan incrustaciones de conocimiento con entrada de texto, una fusión superficial que ignora la rica semántica relacional en grafos de conocimiento e impone una carga de razonamiento implícito pesada en los LLM. SCT contiene dos módulos clave: el módulo de grafo semántico utiliza redes neuronales de grafos para extraer condiciones semánticas conscientes del contexto de vecindarios de grafos locales; el módulo de fusión adaptativa condicional modula adaptativamente incrustaciones de texto a través de dos proyectores parametrizados, logrando una interacción profunda, a nivel de características y consciente del conocimiento.
Incompletitud de Grafos de Conocimiento: Los grafos de conocimiento del mundo real son inherentemente incompletos, limitando su utilidad en aplicaciones posteriores
Limitaciones de la Fusión Superficial: Los métodos existentes de sintonización de prefijo solo realizan operaciones simples de concatenación, sin poder aprovechar plenamente la información estructural de los grafos de conocimiento
Dinamismo de la Semántica Relacional: El significado de las relaciones cambia dinámicamente según su contexto semántico circundante, como se muestra en la Figura 1 donde la relación "treats" representa diferentes mecanismos de tratamiento en diferentes contextos
La completación de grafos de conocimiento es crucial para sistemas de recomendación, extracción de información, sistemas de preguntas y respuestas, entre otras aplicaciones
Los LLM carecen de conocimiento fáctico profundo y preciso, siendo propensos a problemas de alucinación
Es necesario fusionar efectivamente el conocimiento estructurado explícito de grafos de conocimiento con el conocimiento parametrizado implícito de los LLM
Propuesta del Marco SCT: Primer marco de sintonización semántica-condicional que integra conciencia contextual y fusión de incrustaciones adaptativa, superando las limitaciones de la simple concatenación de prefijos existente
Módulo de Grafo Semántico: Propone un novedoso mecanismo de paso de mensajes centrado en relaciones, donde la selección de vecinos está guiada por puntuaciones de similitud semántica explícita de descripciones de relaciones mejoradas con conocimiento
Módulo de Fusión Adaptativa Condicional: Introduce un mecanismo de fusión que utiliza condiciones semánticas para aprender transformaciones afines a nivel de características directas de incrustaciones de texto de entrada, logrando integración cooperativa profunda del contexto de grafo
Validación de Desempeño: Demuestra desempeño de última generación en múltiples puntos de referencia y alta eficiencia de parámetros
El grafo de conocimiento G se define como un conjunto de tripletas T = {(h, r, t) | h, t ∈ E, r ∈ R}, donde E y R representan respectivamente los conjuntos de entidades y relaciones. La tarea de completación de grafo de conocimiento consiste en inferir elementos faltantes en tripletas dadas, como predecir la entidad cola t en la consulta (h, r, ?). En KGC basado en LLM, esta tarea se formaliza como un problema de generación de texto.
Utiliza el mecanismo Feature-wise Linear Modulation (FiLM):
X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)
donde γ es el vector de escala y β es el vector de desplazamiento, logrando transformaciones afines a nivel de características en incrustaciones de texto.
Fusión Profunda vs Concatenación Superficial: A diferencia de la simple concatenación de prefijos, SCT logra interacción profunda a nivel de características
Selección de Vecinos Impulsada por Semántica: Utiliza descripciones de relaciones mejoradas con LLM para cálculo de similitud semántica, en lugar de representaciones aprendidas específicas de tareas
Procesamiento de Grafos Centrado en Relaciones: Se enfoca en relaciones en lugar de entidades, siendo más eficiente e indicativo semánticamente
Efecto de Mejora Semántica:
Para la consulta (Barack Obama, /government/politician/government_positions_held..., ?):
Sin Mejora de Conocimiento: Basado en superposición léxica, Gov Position (Title) etc. se clasifican más alto
Con Mejora de Conocimiento: Conceptos semánticamente relacionados como Person (Nationality) mejoran su clasificación, reflejando la transición de coincidencia de texto superficial a verdadera relevancia semántica
Sensibilidad de Hiperparámetros:
El parámetro Top-K logra el mejor desempeño en K=10 (MRR=0.471, Hit@1=0.380), siendo K=4 demasiado pequeño (información insuficiente) y K=32 demasiado grande (introduce ruido).
Fuerte Innovación Metodológica: Primera propuesta de paradigma de fusión profunda a nivel de características, superando limitaciones de sintonización de prefijo tradicional
Diseño Técnico Razonable: El paso de mensajes centrado en relaciones y selección de vecinos impulsada por semántica están ingeniosamente diseñados
Experimentación Completa y Exhaustiva: Cubre dos categorías de tareas (predicción de enlaces y clasificación de tripletas), validadas en múltiples conjuntos de datos
Experimentos de Ablación Detallados: Valida sistemáticamente la contribución de cada componente
Análisis de Casos Profundo: Demuestra el efecto de mejora semántica mediante ejemplos concretos
El artículo cita 80 referencias relacionadas, cubriendo múltiples campos incluyendo incrustación de grafos de conocimiento, redes neuronales de grafos, modelos de lenguaje grande, etc., proporcionando una base teórica sólida para la investigación. Las referencias clave incluyen métodos clásicos de incrustación de KG como TransE, RotatE, así como trabajos representativos de fusión LLM-KG como KG-BERT, KoPA.