Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
Semantic-Condition Tuning: Fusion von Graphkontext mit großen Sprachmodellen zur Vervollständigung von Wissensgraphen
Das Papier stellt Semantic-Condition Tuning (SCT) vor, ein neues Wissensinjektion-Paradigma zur Lösung des Fusionsproblems zwischen Wissensgraphen und großen Sprachmodellen bei der Aufgabe der Wissensgraph-Vervollständigung. Herkömmliche Präfix-Tuning-Methoden verbinden einfach Wissenseinbettungen mit Texteingaben, wobei diese oberflächliche Fusion die reiche Beziehungssemantik in Wissensgraphen ignoriert und dem LLM eine schwere implizite Inferenzlast auferlegt. SCT enthält zwei Schlüsselmodule: Das semantische Graphmodul nutzt Graphneuronale Netze zur Extraktion kontextbewusster semantischer Bedingungen aus lokalen Graphnachbarschaften; das bedingt-adaptive Fusionsmodul moduliert Texteinbettungen adaptiv durch zwei parametrisierte Projektoren und ermöglicht tiefe, merkmalsstufen- und wissensbewusste Interaktionen.
Unvollständigkeit von Wissensgraphen: Wissensgraphen in der realen Welt sind inhärent unvollständig, was ihre Nützlichkeit in nachgelagerten Anwendungen einschränkt
Einschränkungen oberflächlicher Fusion: Bestehende Präfix-Tuning-Methoden führen nur einfache Verkettungsoperationen durch und können die Strukturinformationen von Wissensgraphen nicht vollständig nutzen
Dynamik der Beziehungssemantik: Die Bedeutung von Beziehungen ändert sich dynamisch je nach semantischem Kontext, wie die "treats"-Beziehung in Abbildung 1 in verschiedenen Kontexten unterschiedliche Behandlungsmechanismen darstellt
Die Vervollständigung von Wissensgraphen ist für Empfehlungssysteme, Informationsextraktion, Frage-Antwort-Systeme und andere Anwendungen von entscheidender Bedeutung
LLMs mangelt es an tiefem und präzisem faktischem Wissen, was zu Halluzinationsproblemen führt
Es ist notwendig, das explizite strukturierte Wissen von Wissensgraphen mit dem impliziten parametrisierten Wissen von LLMs effektiv zu fusionieren
SCT-Framework: Das erste semantische Bedingungs-Tuning-Framework, das kontextbewusstsein und adaptive Einbettungsfusion integriert und die Einschränkungen einfacher Präfix-Tuning-Verkettung überwindet
Semantisches Graphmodul: Stellt einen neuartigen beziehungszentrischen Nachrichtenübergabemechanismus vor, wobei die Nachbarschaftsauswahl durch explizite Semantik-Ähnlichkeitswerte gelenkt wird, die durch wissensverstärkte Beziehungsbeschreibungen informiert sind
Bedingt-adaptives Fusionsmodul: Führt einen Fusionsmechanismus ein, der semantische Bedingungen nutzt, um direkte merkmalsstufen-Affintransformationen von Eingabetexteinbettungen zu lernen und eine tiefe Kointegration des Graphkontextes zu ermöglichen
Leistungsvalidierung: Demonstriert die hochmoderne Leistung und hohe Parametereffizienz von SCT über mehrere Benchmark-Tests hinweg
Ein Wissensgraph G ist als Menge von Tripeln T = {(h, r, t) | h, t ∈ E, r ∈ R} definiert, wobei E und R jeweils Entitäts- und Beziehungsmengen darstellen. Die Aufgabe der Wissensgraph-Vervollständigung besteht darin, fehlende Elemente in einem gegebenen Tripel abzuleiten, wie beispielsweise die Vorhersage der Entwertung t für die Abfrage (h, r, ?). Bei der LLM-basierten KGC wird diese Aufgabe als Textgenerierungsproblem formalisiert.
Semantische Verstärkungseffekte:
Mit der Abfrage (Barack Obama, /government/politician/government_positions_held..., ?):
Ohne Wissensverstärkung: Basierend auf lexikalischer Überlappung, Gov Position (Title) usw. rangieren oben
Mit Wissensverstärkung: Semantisch relevante Konzepte wie Person (Nationality) verbessern ihre Rankings, was den Übergang von oberflächlichem Textabgleich zu echter semantischer Relevanz widerspiegelt
Hyperparameter-Sensitivität:
Der Top-K-Parameter erreicht optimale Leistung bei K=10 (MRR=0,471, Hit@1=0,380), zu klein (K=4) führt zu unzureichenden Informationen, zu groß (K=32) führt zu Rauschen.
Starke Methodennovation: Erstmals Vorschlag eines merkmalsstufen-tiefen Fusionsparadigmas, das die Einschränkungen traditionellen Präfix-Tuning durchbricht
Vernünftige technische Gestaltung: Beziehungszentrierte Nachrichtenübergabe und semantisch gesteuerte Nachbarschaftsauswahl sind sinnvoll konzipiert
Umfassende Experimente: Umfasst Link-Vorhersage- und Tripel-Klassifizierungsaufgaben, validiert über mehrere Datensätze
Detaillierte Ablationsstudien: Systematische Validierung der Komponentenbeiträge
Tiefe Fallstudien: Zeigt durch konkrete Beispiele die Effekte semantischer Verstärkung
Das Papier zitiert 80 verwandte Literaturquellen, die Wissensgraph-Einbettungen, Graphneuronale Netze, große Sprachmodelle und andere Bereiche abdecken und eine solide theoretische Grundlage für die Forschung bieten. Zu den Schlüsselreferenzen gehören klassische KG-Einbettungsmethoden wie TransE und RotatE sowie repräsentative Arbeiten zur LLM-KG-Fusion wie KG-BERT und KoPA.