2025-11-22T20:07:15.604385

Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion

Liu, Wen, Sun et al.

Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.

academic

Semantic-Condition Tuning: Fusione del Contesto Grafico con Modelli Linguistici di Grandi Dimensioni per il Completamento di Grafi di Conoscenza

Informazioni Fondamentali

ID Articolo: 2510.08966
Titolo: Semantic-Condition Tuning: Fusione del Contesto Grafico con Modelli Linguistici di Grandi Dimensioni per il Completamento di Grafi di Conoscenza
Autori: Ruitong Liu, Yan Wen, Te Sun, Yunjia Wu, Pingyang Huang, Zihang Yu, Siyuan Li
Classificazione: cs.AI cs.CL
Data di Pubblicazione/Conferenza: The ACM Web Conference, 13-17 aprile 2026, Dubai, Emirati Arabi Uniti
Link Articolo: https://arxiv.org/abs/2510.08966

Riassunto

Questo articolo propone Semantic-Condition Tuning (SCT), un nuovo paradigma di iniezione di conoscenza per affrontare il problema della fusione tra grafi di conoscenza e modelli linguistici di grandi dimensioni (LLM) nel compito di completamento di grafi di conoscenza. I metodi tradizionali di sintonizzazione con prefisso concatenano semplicemente gli embedding di conoscenza con l'input testuale, una fusione superficiale che ignora la ricca semantica relazionale nel grafo di conoscenza e impone un pesante onere di ragionamento implicito all'LLM. SCT contiene due moduli chiave: il modulo grafico semantico utilizza reti neurali grafiche per estrarre condizioni semantiche consapevoli del contesto dal vicinato grafico locale; il modulo di fusione adattiva condizionata modula adattivamente gli embedding testuali attraverso due proiettori parametrizzati, realizzando un'interazione profonda, a livello di caratteristiche e consapevole della conoscenza.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

Incompletezza del Grafo di Conoscenza: I grafi di conoscenza del mondo reale sono intrinsecamente incompleti, limitando la loro utilità nelle applicazioni a valle
Limitazioni della Fusione Superficiale: I metodi di sintonizzazione con prefisso esistenti eseguono solo semplici operazioni di concatenazione, non riuscendo a sfruttare pienamente le informazioni strutturali del grafo di conoscenza
Dinamicità della Semantica Relazionale: Il significato delle relazioni varia dinamicamente in base al contesto semantico circostante, come mostrato nella Figura 1 dove la relazione "treats" rappresenta diversi meccanismi di trattamento in contesti differenti

Importanza della Ricerca

Il completamento del grafo di conoscenza è cruciale per sistemi di raccomandazione, estrazione di informazioni, sistemi di domande e risposte e altre applicazioni
Gli LLM mancano di conoscenze fattuali profonde e precise, essendo soggetti al problema delle allucinazioni
È necessaria una fusione efficace tra la conoscenza strutturata esplicita dei grafi di conoscenza e la conoscenza parametrizzata implicita degli LLM

Limitazioni dei Metodi Esistenti

Superficialità della Sintonizzazione con Prefisso: Le semplici operazioni di concatenazione non consentono un'integrazione profonda
Ignoranza della Semantica Relazionale: Mancata cattura della ricca semantica relazionale nei grafi di conoscenza
Onere di Ragionamento: Impone un pesante onere di ragionamento implicito all'LLM per associare il prefisso al testo

Contributi Fondamentali

Proposta del Framework SCT: Primo framework di sintonizzazione condizionata semantica che integra consapevolezza del contesto e fusione di embedding adattiva, superando le limitazioni della semplice concatenazione con prefisso
Modulo Grafico Semantico: Propone un innovativo meccanismo di passaggio di messaggi incentrato sulle relazioni, con la selezione dei vicini guidata da punteggi di similarità semantica esplicita arricchiti di conoscenza nelle descrizioni relazionali
Modulo di Fusione Adattiva Condizionata: Introduce un meccanismo di fusione che utilizza condizioni semantiche per apprendere trasformazioni affini dirette a livello di caratteristiche degli embedding testuali di input, realizzando un'integrazione sinergica profonda del contesto grafico
Verifica delle Prestazioni: Dimostra le prestazioni all'avanguardia di SCT e l'elevata efficienza parametrica su più benchmark

Dettagli del Metodo

Definizione del Compito

Il grafo di conoscenza G è definito come un insieme di triple T = {(h, r, t) | h, t ∈ E, r ∈ R}, dove E e R rappresentano rispettivamente gli insiemi di entità e relazioni. Il compito di completamento del grafo di conoscenza consiste nell'inferire elementi mancanti in una tripla data, come la previsione dell'entità coda t per la query (h, r, ?). Nel completamento basato su LLM, questo compito è formalizzato come un problema di generazione testuale.

Architettura del Modello

1. Modulo Grafico Semantico (Semantic Graph Module)

Arricchimento di Conoscenza:

Utilizza un potente LLM (GPT-4O) per generare descrizioni testuali canoniche per ogni tipo di relazione
Codifica le descrizioni come vettori semantici utilizzando un modello di embedding testuale pre-addestrato (Sentence-BERT)

Passaggio di Messaggi Incentrato sulle Relazioni:

Utilizza la struttura relazionale del KG come grafo di calcolo principale
Gli archi (relazioni) aggiornano il loro stato aggregando informazioni da archi vicini
Utilizza un meccanismo di selezione Top-K per filtrare i vicini semanticamente più rilevanti:

Score(ec, en) = (sc · sn) / (||sc||2 ||sn||2)

Aggiornamento del Livello Transformer:

s^(l+1)_c = TransformerLayer(s^l_c, s̄_N_K(ec))

Generazione di Condizioni Semantiche:

cS = MeanPool({s^L_h,i}_i ∪ {s^L_t,j}_j)

2. Modulo di Fusione Adattiva Condizionata (Condition-Adaptive Fusion Module)

Utilizza il meccanismo Feature-wise Linear Modulation (FiLM):

X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)

dove γ è il vettore di scala e β è il vettore di offset, realizzando trasformazioni affini a livello di caratteristiche degli embedding testuali.

Punti di Innovazione Tecnica

Fusione Profonda vs Concatenazione Superficiale: A differenza della semplice concatenazione con prefisso, SCT realizza interazioni profonde a livello di caratteristiche
Selezione dei Vicini Guidata dalla Semantica: Utilizza descrizioni relazionali arricchite da LLM per il calcolo della similarità semantica, piuttosto che rappresentazioni apprese specifiche del compito
Elaborazione Grafica Incentrata sulle Relazioni: Si concentra sulle relazioni piuttosto che sulle entità, risultando più efficiente e semanticamente indicativa

Configurazione Sperimentale

Dataset

Previsione di Collegamento:

WN18RR: 40.943 entità, 11 relazioni, 86.835 triple di addestramento
FB15k-237: 14.541 entità, 237 relazioni, 272.115 triple di addestramento

Classificazione di Triple:

UMLS: 135 entità, 46 relazioni
CoDeX-S: 2.034 entità, 42 relazioni
FB15k-237N: 13.104 entità, 93 relazioni

Metriche di Valutazione

Previsione di Collegamento: Mean Reciprocal Rank (MRR) e Hits@N
Classificazione di Triple: Accuracy (Acc), Precision (P), Recall (R), F1-Score

Metodi di Confronto

Metodi di Embedding: TransE, CompGCN, AdaProp, MA-GNN e altri Metodi LLM: KICGPT, KG-FIT, MKGL, SSQR-LLaMA2, KoPA e altri

Dettagli di Implementazione

Implementazione basata su Alpaca-7B
Modulo grafico semantico: 2 livelli Transformer, Top-K=10
Sintonizzazione LLM utilizzando LoRA (rank=64)
Ottimizzatore AdamW, dimensione batch 12
Strategia di addestramento in due fasi

Risultati Sperimentali

Risultati Principali

Prestazioni di Previsione di Collegamento:

Dataset WN18RR: Miglioramento MRR del 2,2% rispetto al baseline più forte SSQR-LLaMA2, miglioramento Hits@1 del 2,4%, miglioramento Hits@3 del 2,6%
Dataset FB15k-237: Miglioramento significativo MRR del 4,9%, miglioramento Hits@1 del 1,6%, miglioramento Hits@10 del 4,4%

Prestazioni di Classificazione di Triple:

Dataset UMLS: Accuratezza 93,15%, punteggio F1 93,18%, raggiungimento delle migliori prestazioni
Dataset FB15k-237N: Accuratezza 78,02%, precisione 71,10%, punteggio F1 80,93%, tutti i migliori
Dataset CoDeX-S: Precisione 78,52% la più alta, altri indicatori comparabili con baseline forti

Esperimenti di Ablazione

Verifica dell'Efficacia dei Componenti:

w/o Semantics: Rimozione del modulo grafico semantico, sostituzione con KGE tradizionale
- Su FB15k-237 MRR diminuisce da 0,471 a 0,433, Hits@1 da 0,380 a 0,327
w/o Fusion: Rimozione del modulo di fusione adattiva condizionata, utilizzo della sintonizzazione con prefisso
- Calo di prestazioni più grave, MRR e Hits@1 diminuiscono rispettivamente di 0,062 e 0,081

Confronto delle Funzioni di Scoring:

La funzione di stile RotatE mostra le migliori prestazioni, MRR raggiunge 0,471
DistMult semplice e MLP causano cali evidenti di prestazioni

Analisi di Casi

Effetto dell'Arricchimento Semantico: Per la query (Barack Obama, /government/politician/government_positions_held..., ?):

Senza Arricchimento di Conoscenza: Basato sulla sovrapposizione lessicale, Gov Position (Title) e simili si classificano in alto
Con Arricchimento di Conoscenza: Concetti semanticamente correlati come Person (Nationality) migliorano la loro classificazione, riflettendo la transizione dalla corrispondenza testuale superficiale alla vera rilevanza semantica

Sensibilità degli Iperparametri: Il parametro Top-K raggiunge le migliori prestazioni a K=10 (MRR=0,471, Hit@1=0,380), con K=10 troppo piccolo (K=4) informazioni insufficienti, K troppo grande (K=32) introduce rumore.

Lavori Correlati

Completamento del Grafo di Conoscenza

Metodi di Embedding: Evoluzione dai modelli geometrici TransE, ComplEx a metodi di spazio geometrico più complessi come RotE, HAKE
Metodi GNN: PathCon, CBLiP e altri aggregano informazioni di percorsi multi-hop, ma rimangono basati su rappresentazioni statiche
Metodi LLM: KG-BERT, SimKGC e altri convertono triple in sequenze testuali, ma l'interazione rimane a livello superficiale

Fusione di LLM e Grafi di Conoscenza

Due direzioni principali:

Utilizzo di KG per fornire basi fattuali agli LLM, riducendo le allucinazioni
Sfruttamento delle capacità generative e di ragionamento degli LLM per risolvere compiti correlati a KG

Limitazione comune dei metodi esistenti: L'interazione con i grafi di conoscenza spesso rimane a livello testuale o superficiale.

Conclusioni e Discussione

Conclusioni Principali

SCT supera significativamente i metodi di sintonizzazione con prefisso superficiale attraverso la fusione profonda a livello di caratteristiche
Il modulo grafico semantico cattura efficacemente la semantica relazionale consapevole del contesto
Il modulo di fusione adattiva condizionata realizza un'integrazione sinergica profonda tra conoscenza e testo
Raggiunge prestazioni all'avanguardia o altamente competitive su più benchmark

Limitazioni

Profondità di Ragionamento Limitata: La profondità di ragionamento del framework attuale rimane limitata
Adattabilità Insufficiente ai Grafi di Conoscenza Dinamici: L'adattabilità ai grafi di conoscenza che cambiano dinamicamente necessita di miglioramenti
Complessità Computazionale: L'addestramento in due fasi e i meccanismi di fusione complessi aumentano i costi computazionali

Direzioni Future

Generazione Gerarchica di Condizioni Semantiche: Introduzione di meccanismi gerarchici per aumentare la profondità di ragionamento
Consapevolezza Temporale: Integrazione di capacità consapevoli del tempo per gestire conoscenze dinamiche
Estensione degli Scenari Applicativi: Esplorazione dell'applicazione in scenari più complessi come grafi di conoscenza temporali

Valutazione Approfondita

Vantaggi

Forte Innovazione del Metodo: Primo a proporre un paradigma di fusione profonda a livello di caratteristiche, superando le limitazioni della sintonizzazione con prefisso tradizionale
Design Tecnico Razionale: Il passaggio di messaggi incentrato sulle relazioni e la selezione dei vicini guidata dalla semantica sono progettati ingegnosamente
Esperimenti Completi e Approfonditi: Coprono sia compiti di previsione di collegamento che di classificazione di triple, verificati su più dataset
Esperimenti di Ablazione Dettagliati: Verifica sistematica del contributo di ogni componente
Analisi di Casi Approfondita: Dimostra gli effetti dell'arricchimento semantico attraverso esempi concreti

Insufficienze

Analisi della Complessità Computazionale Incompleta: Manca un'analisi dettagliata dei costi computazionali dell'addestramento in due fasi
Discussione Limitata sulla Scalabilità: L'analisi dell'applicabilità a grafi di conoscenza su larga scala è insufficiente
Assenza di Analisi degli Errori: Manca un'analisi approfondita dei casi di fallimento
Selezione dei Baseline: Alcuni metodi baseline potrebbero non essere i più recenti e forti

Impatto

Contributo Teorico: Fornisce un nuovo paradigma per la fusione tra grafi di conoscenza e LLM
Valore Pratico: Le eccellenti prestazioni su più benchmark dimostrano l'utilità pratica
Riproducibilità: Fornisce dettagli di implementazione dettagliati, facilitando la riproduzione
Ispirazione: L'idea della fusione a livello di caratteristiche potrebbe ispirare ricerche correlate

Scenari Applicabili

Compiti Intensivi di Conoscenza: Particolarmente adatto a compiti di ragionamento che richiedono conoscenza strutturata
Grafi di Conoscenza di Medie Dimensioni: La scala sperimentale attuale suggerisce l'idoneità per applicazioni KG di medie dimensioni
Scenari con Elevati Requisiti di Accuratezza: Eccelle in applicazioni dove l'accuratezza è più importante dell'efficienza
Necessità di Ragionamento Multi-hop: Gestisce efficacemente query complesse che richiedono ragionamento multi-hop

Bibliografia

L'articolo cita 80 lavori correlati, coprendo molteplici domini inclusi embedding di grafi di conoscenza, reti neurali grafiche, modelli linguistici di grandi dimensioni, fornendo una solida base teorica per la ricerca. I riferimenti chiave includono metodi classici di embedding KG come TransE, RotatE, e lavori rappresentativi di fusione LLM-KG come KG-BERT, KoPA.