Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
Semantic-Condition Tuning: Fusione del Contesto Grafico con Modelli Linguistici di Grandi Dimensioni per il Completamento di Grafi di Conoscenza
Titolo: Semantic-Condition Tuning: Fusione del Contesto Grafico con Modelli Linguistici di Grandi Dimensioni per il Completamento di Grafi di Conoscenza
Autori: Ruitong Liu, Yan Wen, Te Sun, Yunjia Wu, Pingyang Huang, Zihang Yu, Siyuan Li
Classificazione: cs.AI cs.CL
Data di Pubblicazione/Conferenza: The ACM Web Conference, 13-17 aprile 2026, Dubai, Emirati Arabi Uniti
Questo articolo propone Semantic-Condition Tuning (SCT), un nuovo paradigma di iniezione di conoscenza per affrontare il problema della fusione tra grafi di conoscenza e modelli linguistici di grandi dimensioni (LLM) nel compito di completamento di grafi di conoscenza. I metodi tradizionali di sintonizzazione con prefisso concatenano semplicemente gli embedding di conoscenza con l'input testuale, una fusione superficiale che ignora la ricca semantica relazionale nel grafo di conoscenza e impone un pesante onere di ragionamento implicito all'LLM. SCT contiene due moduli chiave: il modulo grafico semantico utilizza reti neurali grafiche per estrarre condizioni semantiche consapevoli del contesto dal vicinato grafico locale; il modulo di fusione adattiva condizionata modula adattivamente gli embedding testuali attraverso due proiettori parametrizzati, realizzando un'interazione profonda, a livello di caratteristiche e consapevole della conoscenza.
Incompletezza del Grafo di Conoscenza: I grafi di conoscenza del mondo reale sono intrinsecamente incompleti, limitando la loro utilità nelle applicazioni a valle
Limitazioni della Fusione Superficiale: I metodi di sintonizzazione con prefisso esistenti eseguono solo semplici operazioni di concatenazione, non riuscendo a sfruttare pienamente le informazioni strutturali del grafo di conoscenza
Dinamicità della Semantica Relazionale: Il significato delle relazioni varia dinamicamente in base al contesto semantico circostante, come mostrato nella Figura 1 dove la relazione "treats" rappresenta diversi meccanismi di trattamento in contesti differenti
Il completamento del grafo di conoscenza è cruciale per sistemi di raccomandazione, estrazione di informazioni, sistemi di domande e risposte e altre applicazioni
Gli LLM mancano di conoscenze fattuali profonde e precise, essendo soggetti al problema delle allucinazioni
È necessaria una fusione efficace tra la conoscenza strutturata esplicita dei grafi di conoscenza e la conoscenza parametrizzata implicita degli LLM
Proposta del Framework SCT: Primo framework di sintonizzazione condizionata semantica che integra consapevolezza del contesto e fusione di embedding adattiva, superando le limitazioni della semplice concatenazione con prefisso
Modulo Grafico Semantico: Propone un innovativo meccanismo di passaggio di messaggi incentrato sulle relazioni, con la selezione dei vicini guidata da punteggi di similarità semantica esplicita arricchiti di conoscenza nelle descrizioni relazionali
Modulo di Fusione Adattiva Condizionata: Introduce un meccanismo di fusione che utilizza condizioni semantiche per apprendere trasformazioni affini dirette a livello di caratteristiche degli embedding testuali di input, realizzando un'integrazione sinergica profonda del contesto grafico
Verifica delle Prestazioni: Dimostra le prestazioni all'avanguardia di SCT e l'elevata efficienza parametrica su più benchmark
Il grafo di conoscenza G è definito come un insieme di triple T = {(h, r, t) | h, t ∈ E, r ∈ R}, dove E e R rappresentano rispettivamente gli insiemi di entità e relazioni. Il compito di completamento del grafo di conoscenza consiste nell'inferire elementi mancanti in una tripla data, come la previsione dell'entità coda t per la query (h, r, ?). Nel completamento basato su LLM, questo compito è formalizzato come un problema di generazione testuale.
Fusione Profonda vs Concatenazione Superficiale: A differenza della semplice concatenazione con prefisso, SCT realizza interazioni profonde a livello di caratteristiche
Selezione dei Vicini Guidata dalla Semantica: Utilizza descrizioni relazionali arricchite da LLM per il calcolo della similarità semantica, piuttosto che rappresentazioni apprese specifiche del compito
Elaborazione Grafica Incentrata sulle Relazioni: Si concentra sulle relazioni piuttosto che sulle entità, risultando più efficiente e semanticamente indicativa
Effetto dell'Arricchimento Semantico:
Per la query (Barack Obama, /government/politician/government_positions_held..., ?):
Senza Arricchimento di Conoscenza: Basato sulla sovrapposizione lessicale, Gov Position (Title) e simili si classificano in alto
Con Arricchimento di Conoscenza: Concetti semanticamente correlati come Person (Nationality) migliorano la loro classificazione, riflettendo la transizione dalla corrispondenza testuale superficiale alla vera rilevanza semantica
Sensibilità degli Iperparametri:
Il parametro Top-K raggiunge le migliori prestazioni a K=10 (MRR=0,471, Hit@1=0,380), con K=10 troppo piccolo (K=4) informazioni insufficienti, K troppo grande (K=32) introduce rumore.
Profondità di Ragionamento Limitata: La profondità di ragionamento del framework attuale rimane limitata
Adattabilità Insufficiente ai Grafi di Conoscenza Dinamici: L'adattabilità ai grafi di conoscenza che cambiano dinamicamente necessita di miglioramenti
Complessità Computazionale: L'addestramento in due fasi e i meccanismi di fusione complessi aumentano i costi computazionali
Forte Innovazione del Metodo: Primo a proporre un paradigma di fusione profonda a livello di caratteristiche, superando le limitazioni della sintonizzazione con prefisso tradizionale
Design Tecnico Razionale: Il passaggio di messaggi incentrato sulle relazioni e la selezione dei vicini guidata dalla semantica sono progettati ingegnosamente
Esperimenti Completi e Approfonditi: Coprono sia compiti di previsione di collegamento che di classificazione di triple, verificati su più dataset
Esperimenti di Ablazione Dettagliati: Verifica sistematica del contributo di ogni componente
Analisi di Casi Approfondita: Dimostra gli effetti dell'arricchimento semantico attraverso esempi concreti
L'articolo cita 80 lavori correlati, coprendo molteplici domini inclusi embedding di grafi di conoscenza, reti neurali grafiche, modelli linguistici di grandi dimensioni, fornendo una solida base teorica per la ricerca. I riferimenti chiave includono metodi classici di embedding KG come TransE, RotatE, e lavori rappresentativi di fusione LLM-KG come KG-BERT, KoPA.