2025-11-22T20:07:15.604385

Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion

Liu, Wen, Sun et al.

Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.

academic

Semantic-Condition Tuning: Fusion von Graphkontext mit großen Sprachmodellen zur Vervollständigung von Wissensgraphen

Grundinformationen

Paper-ID: 2510.08966
Titel: Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Autoren: Ruitong Liu, Yan Wen, Te Sun, Yunjia Wu, Pingyang Huang, Zihang Yu, Siyuan Li
Klassifizierung: cs.AI cs.CL
Veröffentlichungszeit/Konferenz: The ACM Web Conference, 13.-17. April 2026, Dubai, VAE
Paper-Link: https://arxiv.org/abs/2510.08966

Zusammenfassung

Das Papier stellt Semantic-Condition Tuning (SCT) vor, ein neues Wissensinjektion-Paradigma zur Lösung des Fusionsproblems zwischen Wissensgraphen und großen Sprachmodellen bei der Aufgabe der Wissensgraph-Vervollständigung. Herkömmliche Präfix-Tuning-Methoden verbinden einfach Wissenseinbettungen mit Texteingaben, wobei diese oberflächliche Fusion die reiche Beziehungssemantik in Wissensgraphen ignoriert und dem LLM eine schwere implizite Inferenzlast auferlegt. SCT enthält zwei Schlüsselmodule: Das semantische Graphmodul nutzt Graphneuronale Netze zur Extraktion kontextbewusster semantischer Bedingungen aus lokalen Graphnachbarschaften; das bedingt-adaptive Fusionsmodul moduliert Texteinbettungen adaptiv durch zwei parametrisierte Projektoren und ermöglicht tiefe, merkmalsstufen- und wissensbewusste Interaktionen.

Forschungshintergrund und Motivation

Kernprobleme

Unvollständigkeit von Wissensgraphen: Wissensgraphen in der realen Welt sind inhärent unvollständig, was ihre Nützlichkeit in nachgelagerten Anwendungen einschränkt
Einschränkungen oberflächlicher Fusion: Bestehende Präfix-Tuning-Methoden führen nur einfache Verkettungsoperationen durch und können die Strukturinformationen von Wissensgraphen nicht vollständig nutzen
Dynamik der Beziehungssemantik: Die Bedeutung von Beziehungen ändert sich dynamisch je nach semantischem Kontext, wie die "treats"-Beziehung in Abbildung 1 in verschiedenen Kontexten unterschiedliche Behandlungsmechanismen darstellt

Forschungsbedeutung

Die Vervollständigung von Wissensgraphen ist für Empfehlungssysteme, Informationsextraktion, Frage-Antwort-Systeme und andere Anwendungen von entscheidender Bedeutung
LLMs mangelt es an tiefem und präzisem faktischem Wissen, was zu Halluzinationsproblemen führt
Es ist notwendig, das explizite strukturierte Wissen von Wissensgraphen mit dem impliziten parametrisierten Wissen von LLMs effektiv zu fusionieren

Einschränkungen bestehender Methoden

Oberflächlichkeit des Präfix-Tuning: Einfache Verkettungsoperationen können keine tiefe Integration erreichen
Ignorieren von Beziehungssemantik: Erfasst nicht die reiche Beziehungssemantik in Wissensgraphen
Inferenzlast: Erlegt dem LLM eine schwere implizite Inferenzlast auf, um Präfixe mit Text zu verbinden

Kernbeiträge

SCT-Framework: Das erste semantische Bedingungs-Tuning-Framework, das kontextbewusstsein und adaptive Einbettungsfusion integriert und die Einschränkungen einfacher Präfix-Tuning-Verkettung überwindet
Semantisches Graphmodul: Stellt einen neuartigen beziehungszentrischen Nachrichtenübergabemechanismus vor, wobei die Nachbarschaftsauswahl durch explizite Semantik-Ähnlichkeitswerte gelenkt wird, die durch wissensverstärkte Beziehungsbeschreibungen informiert sind
Bedingt-adaptives Fusionsmodul: Führt einen Fusionsmechanismus ein, der semantische Bedingungen nutzt, um direkte merkmalsstufen-Affintransformationen von Eingabetexteinbettungen zu lernen und eine tiefe Kointegration des Graphkontextes zu ermöglichen
Leistungsvalidierung: Demonstriert die hochmoderne Leistung und hohe Parametereffizienz von SCT über mehrere Benchmark-Tests hinweg

Methodendetails

Aufgabendefinition

Ein Wissensgraph G ist als Menge von Tripeln T = {(h, r, t) | h, t ∈ E, r ∈ R} definiert, wobei E und R jeweils Entitäts- und Beziehungsmengen darstellen. Die Aufgabe der Wissensgraph-Vervollständigung besteht darin, fehlende Elemente in einem gegebenen Tripel abzuleiten, wie beispielsweise die Vorhersage der Entwertung t für die Abfrage (h, r, ?). Bei der LLM-basierten KGC wird diese Aufgabe als Textgenerierungsproblem formalisiert.

Modellarchitektur

1. Semantisches Graphmodul (Semantic Graph Module)

Wissensverstärkung:

Nutzt ein leistungsstarkes LLM (GPT-4O) zur Generierung kanonischer Textbeschreibungen für jeden Beziehungstyp
Kodiert Beschreibungen mit einem vortrainierten Satzeinbettungsmodell (Sentence-BERT) als semantische Vektoren

Beziehungszentrierte Nachrichtenübergabe:

Nutzt die Beziehungsstruktur des KG als primären Berechnungsgraphen
Kanten (Beziehungen) aktualisieren ihren Status durch Aggregation von Informationen benachbarter Kanten
Nutzt Top-K-Auswahlmechanismus zur Filterung semantisch relevantester Nachbarn:

Score(ec, en) = (sc · sn) / (||sc||2 ||sn||2)

Transformer-Schicht-Update:

s^(l+1)_c = TransformerLayer(s^l_c, s̄_N_K(ec))

Semantische Bedingungsgenerierung:

cS = MeanPool({s^L_h,i}_i ∪ {s^L_t,j}_j)

2. Bedingt-adaptives Fusionsmodul (Condition-Adaptive Fusion Module)

Nutzt Feature-wise Linear Modulation (FiLM)-Mechanismus:

X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)

wobei γ der Skalierungsvektor und β der Versatzvektor ist, was merkmalsstufen-Affintransformationen von Texteinbettungen ermöglicht.

Technische Innovationen

Tiefe Fusion vs. oberflächliche Verkettung: Im Gegensatz zu einfacher Präfix-Verkettung erreicht SCT merkmalsstufen-tiefe Interaktionen
Semantisch gesteuerte Nachbarschaftsauswahl: Nutzt LLM-verstärkte Beziehungsbeschreibungen für Semantik-Ähnlichkeitsberechnung statt aufgabenspezifischer gelernter Darstellungen
Beziehungszentrierte Graphverarbeitung: Konzentriert sich auf Beziehungen statt Entitäten, effizienter und semantisch aussagekräftiger

Experimentelle Einrichtung

Datensätze

Link-Vorhersage:

WN18RR: 40.943 Entitäten, 11 Beziehungen, 86.835 Trainings-Tripel
FB15k-237: 14.541 Entitäten, 237 Beziehungen, 272.115 Trainings-Tripel

Tripel-Klassifizierung:

UMLS: 135 Entitäten, 46 Beziehungen
CoDeX-S: 2.034 Entitäten, 42 Beziehungen
FB15k-237N: 13.104 Entitäten, 93 Beziehungen

Bewertungsmetriken

Link-Vorhersage: Mean Reciprocal Rank (MRR) und Hits@N
Tripel-Klassifizierung: Accuracy (Acc), Precision (P), Recall (R), F1-Score

Vergleichsmethoden

Einbettungsmethoden: TransE, CompGCN, AdaProp, MA-GNN usw. LLM-Methoden: KICGPT, KG-FIT, MKGL, SSQR-LLaMA2, KoPA usw.

Implementierungsdetails

Basierend auf Alpaca-7B implementiert
Semantisches Graphmodul: 2-schichtige Transformer, Top-K=10
LoRA-Feinabstimmung des LLM (rank=64)
AdamW-Optimierer, Batch-Größe 12
Zweistufige Trainingstrategie

Experimentelle Ergebnisse

Hauptergebnisse

Link-Vorhersage-Leistung:

WN18RR-Datensatz: Im Vergleich zur stärksten Baseline SSQR-LLaMA2 MRR-Verbesserung um 2,2%, Hits@1-Verbesserung um 2,4%, Hits@3-Verbesserung um 2,6%
FB15k-237-Datensatz: Signifikante MRR-Verbesserung um 4,9%, Hits@1-Verbesserung um 1,6%, Hits@10-Verbesserung um 4,4%

Tripel-Klassifizierungs-Leistung:

UMLS-Datensatz: Genauigkeit 93,15%, F1-Score 93,18%, erreicht beste Leistung
FB15k-237N-Datensatz: Genauigkeit 78,02%, Präzision 71,10%, F1-Score 80,93%, alle optimal
CoDeX-S-Datensatz: Präzision 78,52% am höchsten, andere Metriken vergleichbar mit starken Baselines

Ablationsstudien

Validierung der Komponenteneffektivität:

w/o Semantics: Entfernt semantisches Graphmodul, ersetzt durch traditionelle KGE
- FB15k-237 MRR sinkt von 0,471 auf 0,433, Hits@1 sinkt von 0,380 auf 0,327
w/o Fusion: Entfernt bedingt-adaptives Fusionsmodul, nutzt stattdessen Präfix-Tuning
- Schwerwiegendster Leistungsabfall, MRR und Hits@1 sinken um 0,062 bzw. 0,081

Vergleich von Bewertungsfunktionen:

RotatE-Stil-Funktion zeigt beste Leistung, MRR erreicht 0,471
Einfache DistMult und MLP führen zu deutlichem Leistungsabfall

Fallstudien

Semantische Verstärkungseffekte: Mit der Abfrage (Barack Obama, /government/politician/government_positions_held..., ?):

Ohne Wissensverstärkung: Basierend auf lexikalischer Überlappung, Gov Position (Title) usw. rangieren oben
Mit Wissensverstärkung: Semantisch relevante Konzepte wie Person (Nationality) verbessern ihre Rankings, was den Übergang von oberflächlichem Textabgleich zu echter semantischer Relevanz widerspiegelt

Hyperparameter-Sensitivität: Der Top-K-Parameter erreicht optimale Leistung bei K=10 (MRR=0,471, Hit@1=0,380), zu klein (K=4) führt zu unzureichenden Informationen, zu groß (K=32) führt zu Rauschen.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

SCT übertrifft oberflächliche Präfix-Tuning-Methoden durch tiefe merkmalsstufen-Fusion erheblich
Das semantische Graphmodul kann kontextbewusste Beziehungssemantik effektiv erfassen
Das bedingt-adaptive Fusionsmodul ermöglicht tiefe Kointegration von Wissen und Text
Erreicht hochmoderne oder hochgradig wettbewerbsfähige Leistung über mehrere Benchmark-Tests

Einschränkungen

Begrenzte Inferenztiefe: Die aktuelle Rahmenwerk-Inferenztiefe ist noch begrenzt
Unzureichende Anpassung an dynamische Wissensgraphen: Die Anpassungsfähigkeit an dynamisch verändernde Wissensgraphen muss verbessert werden
Rechenkomplexität: Zweistufiges Training und komplexe Fusionsmechanismen erhöhen die Rechenkosten

Zukünftige Richtungen

Hierarchische semantische Bedingungsgenerierung: Einführung hierarchischer Mechanismen zur Verbesserung der Inferenztiefe
Zeitbewusstsein: Integration zeitbewusster Fähigkeiten zur Verarbeitung dynamischen Wissens
Erweiterung von Anwendungsszenarien: Erkundung von Anwendungen in komplexeren Szenarien wie zeitlichen Wissensgraphen

Tiefenbewertung

Stärken

Starke Methodennovation: Erstmals Vorschlag eines merkmalsstufen-tiefen Fusionsparadigmas, das die Einschränkungen traditionellen Präfix-Tuning durchbricht
Vernünftige technische Gestaltung: Beziehungszentrierte Nachrichtenübergabe und semantisch gesteuerte Nachbarschaftsauswahl sind sinnvoll konzipiert
Umfassende Experimente: Umfasst Link-Vorhersage- und Tripel-Klassifizierungsaufgaben, validiert über mehrere Datensätze
Detaillierte Ablationsstudien: Systematische Validierung der Komponentenbeiträge
Tiefe Fallstudien: Zeigt durch konkrete Beispiele die Effekte semantischer Verstärkung

Mängel

Unzureichende Rechenkomplexitätsanalyse: Keine detaillierte Analyse der Rechenkosten des zweistufigen Trainings
Begrenzte Skalierungsdiskussion: Unzureichende Analyse der Anwendbarkeit auf sehr große Wissensgraphen
Fehlende Fehleranalyse: Mangel an tiefgehender Analyse fehlgeschlagener Fälle
Baseline-Auswahl: Einige Baseline-Methoden könnten nicht die neuesten stärksten Methoden sein

Auswirkungen

Theoretischer Beitrag: Bietet ein neues Paradigma für die Fusion von Wissensgraphen und LLMs
Praktischer Wert: Hervorragende Leistung über mehrere Benchmark-Tests hinweg beweist Praktikabilität
Reproduzierbarkeit: Bietet detaillierte Implementierungsdetails, die Reproduktion unterstützen
Inspirationskraft: Der Gedanke der merkmalsstufen-Fusion könnte andere verwandte Forschungen inspirieren

Anwendungsszenarien

Wissensintensive Aufgaben: Besonders geeignet für Inferenzaufgaben, die strukturiertes Wissen erfordern
Mittelskalierte Wissensgraphen: Aktuelle experimentelle Skalierung deutet auf Eignung für mittelskalierte KG-Anwendungen hin
Szenarien mit hohen Genauigkeitsanforderungen: Zeigt hervorragende Leistung in Anwendungen, bei denen Genauigkeit wichtiger als Effizienz ist
Mehrsprung-Inferenzbedarf: Kann komplexe Abfragen, die Mehrsprung-Inferenz erfordern, effektiv verarbeiten

Referenzen

Das Papier zitiert 80 verwandte Literaturquellen, die Wissensgraph-Einbettungen, Graphneuronale Netze, große Sprachmodelle und andere Bereiche abdecken und eine solide theoretische Grundlage für die Forschung bieten. Zu den Schlüsselreferenzen gehören klassische KG-Einbettungsmethoden wie TransE und RotatE sowie repräsentative Arbeiten zur LLM-KG-Fusion wie KG-BERT und KoPA.