2025-11-22T20:07:15.604385

Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion

Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic

Semantic-Condition Tuning: Fusion von Graphkontext mit großen Sprachmodellen zur Vervollständigung von Wissensgraphen

Grundinformationen

  • Paper-ID: 2510.08966
  • Titel: Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
  • Autoren: Ruitong Liu, Yan Wen, Te Sun, Yunjia Wu, Pingyang Huang, Zihang Yu, Siyuan Li
  • Klassifizierung: cs.AI cs.CL
  • Veröffentlichungszeit/Konferenz: The ACM Web Conference, 13.-17. April 2026, Dubai, VAE
  • Paper-Link: https://arxiv.org/abs/2510.08966

Zusammenfassung

Das Papier stellt Semantic-Condition Tuning (SCT) vor, ein neues Wissensinjektion-Paradigma zur Lösung des Fusionsproblems zwischen Wissensgraphen und großen Sprachmodellen bei der Aufgabe der Wissensgraph-Vervollständigung. Herkömmliche Präfix-Tuning-Methoden verbinden einfach Wissenseinbettungen mit Texteingaben, wobei diese oberflächliche Fusion die reiche Beziehungssemantik in Wissensgraphen ignoriert und dem LLM eine schwere implizite Inferenzlast auferlegt. SCT enthält zwei Schlüsselmodule: Das semantische Graphmodul nutzt Graphneuronale Netze zur Extraktion kontextbewusster semantischer Bedingungen aus lokalen Graphnachbarschaften; das bedingt-adaptive Fusionsmodul moduliert Texteinbettungen adaptiv durch zwei parametrisierte Projektoren und ermöglicht tiefe, merkmalsstufen- und wissensbewusste Interaktionen.

Forschungshintergrund und Motivation

Kernprobleme

  1. Unvollständigkeit von Wissensgraphen: Wissensgraphen in der realen Welt sind inhärent unvollständig, was ihre Nützlichkeit in nachgelagerten Anwendungen einschränkt
  2. Einschränkungen oberflächlicher Fusion: Bestehende Präfix-Tuning-Methoden führen nur einfache Verkettungsoperationen durch und können die Strukturinformationen von Wissensgraphen nicht vollständig nutzen
  3. Dynamik der Beziehungssemantik: Die Bedeutung von Beziehungen ändert sich dynamisch je nach semantischem Kontext, wie die "treats"-Beziehung in Abbildung 1 in verschiedenen Kontexten unterschiedliche Behandlungsmechanismen darstellt

Forschungsbedeutung

  • Die Vervollständigung von Wissensgraphen ist für Empfehlungssysteme, Informationsextraktion, Frage-Antwort-Systeme und andere Anwendungen von entscheidender Bedeutung
  • LLMs mangelt es an tiefem und präzisem faktischem Wissen, was zu Halluzinationsproblemen führt
  • Es ist notwendig, das explizite strukturierte Wissen von Wissensgraphen mit dem impliziten parametrisierten Wissen von LLMs effektiv zu fusionieren

Einschränkungen bestehender Methoden

  1. Oberflächlichkeit des Präfix-Tuning: Einfache Verkettungsoperationen können keine tiefe Integration erreichen
  2. Ignorieren von Beziehungssemantik: Erfasst nicht die reiche Beziehungssemantik in Wissensgraphen
  3. Inferenzlast: Erlegt dem LLM eine schwere implizite Inferenzlast auf, um Präfixe mit Text zu verbinden

Kernbeiträge

  1. SCT-Framework: Das erste semantische Bedingungs-Tuning-Framework, das kontextbewusstsein und adaptive Einbettungsfusion integriert und die Einschränkungen einfacher Präfix-Tuning-Verkettung überwindet
  2. Semantisches Graphmodul: Stellt einen neuartigen beziehungszentrischen Nachrichtenübergabemechanismus vor, wobei die Nachbarschaftsauswahl durch explizite Semantik-Ähnlichkeitswerte gelenkt wird, die durch wissensverstärkte Beziehungsbeschreibungen informiert sind
  3. Bedingt-adaptives Fusionsmodul: Führt einen Fusionsmechanismus ein, der semantische Bedingungen nutzt, um direkte merkmalsstufen-Affintransformationen von Eingabetexteinbettungen zu lernen und eine tiefe Kointegration des Graphkontextes zu ermöglichen
  4. Leistungsvalidierung: Demonstriert die hochmoderne Leistung und hohe Parametereffizienz von SCT über mehrere Benchmark-Tests hinweg

Methodendetails

Aufgabendefinition

Ein Wissensgraph G ist als Menge von Tripeln T = {(h, r, t) | h, t ∈ E, r ∈ R} definiert, wobei E und R jeweils Entitäts- und Beziehungsmengen darstellen. Die Aufgabe der Wissensgraph-Vervollständigung besteht darin, fehlende Elemente in einem gegebenen Tripel abzuleiten, wie beispielsweise die Vorhersage der Entwertung t für die Abfrage (h, r, ?). Bei der LLM-basierten KGC wird diese Aufgabe als Textgenerierungsproblem formalisiert.

Modellarchitektur

1. Semantisches Graphmodul (Semantic Graph Module)

Wissensverstärkung:

  • Nutzt ein leistungsstarkes LLM (GPT-4O) zur Generierung kanonischer Textbeschreibungen für jeden Beziehungstyp
  • Kodiert Beschreibungen mit einem vortrainierten Satzeinbettungsmodell (Sentence-BERT) als semantische Vektoren

Beziehungszentrierte Nachrichtenübergabe:

  • Nutzt die Beziehungsstruktur des KG als primären Berechnungsgraphen
  • Kanten (Beziehungen) aktualisieren ihren Status durch Aggregation von Informationen benachbarter Kanten
  • Nutzt Top-K-Auswahlmechanismus zur Filterung semantisch relevantester Nachbarn:
Score(ec, en) = (sc · sn) / (||sc||2 ||sn||2)

Transformer-Schicht-Update:

s^(l+1)_c = TransformerLayer(s^l_c, s̄_N_K(ec))

Semantische Bedingungsgenerierung:

cS = MeanPool({s^L_h,i}_i ∪ {s^L_t,j}_j)

2. Bedingt-adaptives Fusionsmodul (Condition-Adaptive Fusion Module)

Nutzt Feature-wise Linear Modulation (FiLM)-Mechanismus:

X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)

wobei γ der Skalierungsvektor und β der Versatzvektor ist, was merkmalsstufen-Affintransformationen von Texteinbettungen ermöglicht.

Technische Innovationen

  1. Tiefe Fusion vs. oberflächliche Verkettung: Im Gegensatz zu einfacher Präfix-Verkettung erreicht SCT merkmalsstufen-tiefe Interaktionen
  2. Semantisch gesteuerte Nachbarschaftsauswahl: Nutzt LLM-verstärkte Beziehungsbeschreibungen für Semantik-Ähnlichkeitsberechnung statt aufgabenspezifischer gelernter Darstellungen
  3. Beziehungszentrierte Graphverarbeitung: Konzentriert sich auf Beziehungen statt Entitäten, effizienter und semantisch aussagekräftiger

Experimentelle Einrichtung

Datensätze

Link-Vorhersage:

  • WN18RR: 40.943 Entitäten, 11 Beziehungen, 86.835 Trainings-Tripel
  • FB15k-237: 14.541 Entitäten, 237 Beziehungen, 272.115 Trainings-Tripel

Tripel-Klassifizierung:

  • UMLS: 135 Entitäten, 46 Beziehungen
  • CoDeX-S: 2.034 Entitäten, 42 Beziehungen
  • FB15k-237N: 13.104 Entitäten, 93 Beziehungen

Bewertungsmetriken

  • Link-Vorhersage: Mean Reciprocal Rank (MRR) und Hits@N
  • Tripel-Klassifizierung: Accuracy (Acc), Precision (P), Recall (R), F1-Score

Vergleichsmethoden

Einbettungsmethoden: TransE, CompGCN, AdaProp, MA-GNN usw. LLM-Methoden: KICGPT, KG-FIT, MKGL, SSQR-LLaMA2, KoPA usw.

Implementierungsdetails

  • Basierend auf Alpaca-7B implementiert
  • Semantisches Graphmodul: 2-schichtige Transformer, Top-K=10
  • LoRA-Feinabstimmung des LLM (rank=64)
  • AdamW-Optimierer, Batch-Größe 12
  • Zweistufige Trainingstrategie

Experimentelle Ergebnisse

Hauptergebnisse

Link-Vorhersage-Leistung:

  • WN18RR-Datensatz: Im Vergleich zur stärksten Baseline SSQR-LLaMA2 MRR-Verbesserung um 2,2%, Hits@1-Verbesserung um 2,4%, Hits@3-Verbesserung um 2,6%
  • FB15k-237-Datensatz: Signifikante MRR-Verbesserung um 4,9%, Hits@1-Verbesserung um 1,6%, Hits@10-Verbesserung um 4,4%

Tripel-Klassifizierungs-Leistung:

  • UMLS-Datensatz: Genauigkeit 93,15%, F1-Score 93,18%, erreicht beste Leistung
  • FB15k-237N-Datensatz: Genauigkeit 78,02%, Präzision 71,10%, F1-Score 80,93%, alle optimal
  • CoDeX-S-Datensatz: Präzision 78,52% am höchsten, andere Metriken vergleichbar mit starken Baselines

Ablationsstudien

Validierung der Komponenteneffektivität:

  1. w/o Semantics: Entfernt semantisches Graphmodul, ersetzt durch traditionelle KGE
    • FB15k-237 MRR sinkt von 0,471 auf 0,433, Hits@1 sinkt von 0,380 auf 0,327
  2. w/o Fusion: Entfernt bedingt-adaptives Fusionsmodul, nutzt stattdessen Präfix-Tuning
    • Schwerwiegendster Leistungsabfall, MRR und Hits@1 sinken um 0,062 bzw. 0,081

Vergleich von Bewertungsfunktionen:

  • RotatE-Stil-Funktion zeigt beste Leistung, MRR erreicht 0,471
  • Einfache DistMult und MLP führen zu deutlichem Leistungsabfall

Fallstudien

Semantische Verstärkungseffekte: Mit der Abfrage (Barack Obama, /government/politician/government_positions_held..., ?):

  • Ohne Wissensverstärkung: Basierend auf lexikalischer Überlappung, Gov Position (Title) usw. rangieren oben
  • Mit Wissensverstärkung: Semantisch relevante Konzepte wie Person (Nationality) verbessern ihre Rankings, was den Übergang von oberflächlichem Textabgleich zu echter semantischer Relevanz widerspiegelt

Hyperparameter-Sensitivität: Der Top-K-Parameter erreicht optimale Leistung bei K=10 (MRR=0,471, Hit@1=0,380), zu klein (K=4) führt zu unzureichenden Informationen, zu groß (K=32) führt zu Rauschen.

Verwandte Arbeiten

Wissensgraph-Vervollständigung

  1. Einbettungsmethoden: Entwicklung von geometrischen Modellen wie TransE, ComplEx zu komplexeren geometrischen Raummethoden wie RotE, HAKE
  2. GNN-Methoden: PathCon, CBLiP usw. aggregieren Mehrsprung-Pfadinformationen, basieren aber immer noch auf statischen Darstellungen
  3. LLM-Methoden: KG-BERT, SimKGC usw. konvertieren Tripel in Textsequenzen, aber Interaktionen bleiben oberflächlich

Fusion von LLMs und Wissensgraphen

Zwei Hauptrichtungen:

  1. KGs bieten LLMs faktische Grundlagen, um Halluzinationen zu reduzieren
  2. Nutzen Sie die Generierungs- und Inferenzfähigkeiten von LLMs zur Lösung KG-bezogener Aufgaben

Gemeinsame Einschränkung bestehender Methoden: Die Interaktion mit Wissensgraphen bleibt oft auf Text- oder Oberflächenebene.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. SCT übertrifft oberflächliche Präfix-Tuning-Methoden durch tiefe merkmalsstufen-Fusion erheblich
  2. Das semantische Graphmodul kann kontextbewusste Beziehungssemantik effektiv erfassen
  3. Das bedingt-adaptive Fusionsmodul ermöglicht tiefe Kointegration von Wissen und Text
  4. Erreicht hochmoderne oder hochgradig wettbewerbsfähige Leistung über mehrere Benchmark-Tests

Einschränkungen

  1. Begrenzte Inferenztiefe: Die aktuelle Rahmenwerk-Inferenztiefe ist noch begrenzt
  2. Unzureichende Anpassung an dynamische Wissensgraphen: Die Anpassungsfähigkeit an dynamisch verändernde Wissensgraphen muss verbessert werden
  3. Rechenkomplexität: Zweistufiges Training und komplexe Fusionsmechanismen erhöhen die Rechenkosten

Zukünftige Richtungen

  1. Hierarchische semantische Bedingungsgenerierung: Einführung hierarchischer Mechanismen zur Verbesserung der Inferenztiefe
  2. Zeitbewusstsein: Integration zeitbewusster Fähigkeiten zur Verarbeitung dynamischen Wissens
  3. Erweiterung von Anwendungsszenarien: Erkundung von Anwendungen in komplexeren Szenarien wie zeitlichen Wissensgraphen

Tiefenbewertung

Stärken

  1. Starke Methodennovation: Erstmals Vorschlag eines merkmalsstufen-tiefen Fusionsparadigmas, das die Einschränkungen traditionellen Präfix-Tuning durchbricht
  2. Vernünftige technische Gestaltung: Beziehungszentrierte Nachrichtenübergabe und semantisch gesteuerte Nachbarschaftsauswahl sind sinnvoll konzipiert
  3. Umfassende Experimente: Umfasst Link-Vorhersage- und Tripel-Klassifizierungsaufgaben, validiert über mehrere Datensätze
  4. Detaillierte Ablationsstudien: Systematische Validierung der Komponentenbeiträge
  5. Tiefe Fallstudien: Zeigt durch konkrete Beispiele die Effekte semantischer Verstärkung

Mängel

  1. Unzureichende Rechenkomplexitätsanalyse: Keine detaillierte Analyse der Rechenkosten des zweistufigen Trainings
  2. Begrenzte Skalierungsdiskussion: Unzureichende Analyse der Anwendbarkeit auf sehr große Wissensgraphen
  3. Fehlende Fehleranalyse: Mangel an tiefgehender Analyse fehlgeschlagener Fälle
  4. Baseline-Auswahl: Einige Baseline-Methoden könnten nicht die neuesten stärksten Methoden sein

Auswirkungen

  1. Theoretischer Beitrag: Bietet ein neues Paradigma für die Fusion von Wissensgraphen und LLMs
  2. Praktischer Wert: Hervorragende Leistung über mehrere Benchmark-Tests hinweg beweist Praktikabilität
  3. Reproduzierbarkeit: Bietet detaillierte Implementierungsdetails, die Reproduktion unterstützen
  4. Inspirationskraft: Der Gedanke der merkmalsstufen-Fusion könnte andere verwandte Forschungen inspirieren

Anwendungsszenarien

  1. Wissensintensive Aufgaben: Besonders geeignet für Inferenzaufgaben, die strukturiertes Wissen erfordern
  2. Mittelskalierte Wissensgraphen: Aktuelle experimentelle Skalierung deutet auf Eignung für mittelskalierte KG-Anwendungen hin
  3. Szenarien mit hohen Genauigkeitsanforderungen: Zeigt hervorragende Leistung in Anwendungen, bei denen Genauigkeit wichtiger als Effizienz ist
  4. Mehrsprung-Inferenzbedarf: Kann komplexe Abfragen, die Mehrsprung-Inferenz erfordern, effektiv verarbeiten

Referenzen

Das Papier zitiert 80 verwandte Literaturquellen, die Wissensgraph-Einbettungen, Graphneuronale Netze, große Sprachmodelle und andere Bereiche abdecken und eine solide theoretische Grundlage für die Forschung bieten. Zu den Schlüsselreferenzen gehören klassische KG-Einbettungsmethoden wie TransE und RotatE sowie repräsentative Arbeiten zur LLM-KG-Fusion wie KG-BERT und KoPA.