Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
Semantic-Condition Tuning : Fusion du Contexte Graphique avec les Grands Modèles de Langage pour la Complétion de Graphes de Connaissances
Cet article propose Semantic-Condition Tuning (SCT), un nouveau paradigme d'injection de connaissances pour résoudre le problème de fusion entre les graphes de connaissances et les grands modèles de langage dans les tâches de complétion de graphes de connaissances. Les méthodes traditionnelles d'ajustement par préfixe concatènent simplement les plongements de connaissances avec les entrées textuelles, une fusion superficielle qui ignore la riche sémantique relationnelle dans les graphes de connaissances et impose une lourde charge de raisonnement implicite aux LLMs. SCT comprend deux modules clés : le module graphique sémantique utilise les réseaux de neurones graphiques pour extraire les conditions sémantiques conscientes du contexte à partir des voisinages graphiques locaux ; le module de fusion adaptative conditionnelle module de manière adaptative les plongements textuels par deux projecteurs paramétrés, réalisant une interaction profonde, au niveau des caractéristiques et consciente des connaissances.
Incomplétude des graphes de connaissances : Les graphes de connaissances du monde réel sont intrinsèquement incomplets, limitant leur utilité dans les applications en aval
Limitations de la fusion superficielle : Les méthodes d'ajustement par préfixe existantes effectuent uniquement des opérations de concaténation simples, ne pouvant pas exploiter pleinement les informations structurelles des graphes de connaissances
Dynamique de la sémantique relationnelle : La signification des relations varie dynamiquement selon le contexte sémantique environnant, comme la relation « treats » illustrée à la Figure 1 qui représente différents mécanismes de traitement dans différents contextes
La complétion de graphes de connaissances est cruciale pour les systèmes de recommandation, l'extraction d'informations, les systèmes de questions-réponses et autres applications
Les LLMs manquent de connaissances factuelles profondes et précises, étant sujets aux problèmes d'hallucination
Il est nécessaire de fusionner efficacement les connaissances structurées explicites des graphes de connaissances avec les connaissances paramétrées implicites des LLMs
Proposition du cadre SCT : Premier cadre d'ajustement sémantique conditionnel intégrant la conscience du contexte et la fusion d'plongements adaptative, surmontant les limitations des simples concaténations de préfixe existantes
Module graphique sémantique : Propose un nouveau mécanisme de passage de messages centré sur les relations, où la sélection des voisins est guidée par des scores de similarité sémantique explicites provenant de descriptions relationnelles enrichies en connaissances
Module de fusion adaptative conditionnelle : Introduit un mécanisme de fusion utilisant des conditions sémantiques pour apprendre les transformations affines directes au niveau des caractéristiques des plongements textuels d'entrée, réalisant une intégration synergique profonde du contexte graphique
Validation des performances : Démontre les performances de pointe et l'efficacité paramétrique élevée de SCT sur plusieurs benchmarks
Un graphe de connaissances G est défini comme un ensemble de triplets T = {(h, r, t) | h, t ∈ E, r ∈ R}, où E et R représentent respectivement les ensembles d'entités et de relations. La tâche de complétion de graphe de connaissances consiste à déduire les éléments manquants dans un triplet donné, comme prédire l'entité de queue t pour la requête (h, r, ?). Dans la complétion de KG basée sur LLM, cette tâche est formalisée comme un problème de génération de texte.
Utilise le mécanisme Feature-wise Linear Modulation (FiLM) :
X' = X ⊙ γ + β
γ = σ(MLP1(cS))
β = MLP2(cS)
où γ est le vecteur d'échelle et β est le vecteur de décalage, réalisant une transformation affine au niveau des caractéristiques des plongements textuels.
Fusion profonde vs concaténation superficielle : Contrairement à la simple concaténation de préfixe, SCT réalise une interaction profonde au niveau des caractéristiques
Sélection de voisins guidée par la sémantique : Utilise des descriptions de relations enrichies par LLM pour le calcul de similarité sémantique, plutôt que des représentations apprises spécifiques à la tâche
Traitement graphique centré sur les relations : Se concentre sur les relations plutôt que sur les entités, plus efficace et sémantiquement plus indicatif
Ensemble de données WN18RR : Amélioration de 2,2 % du MRR par rapport à la ligne de base la plus forte SSQR-LLaMA2, amélioration de 2,4 % de Hits@1, amélioration de 2,6 % de Hits@3
Ensemble de données FB15k-237 : Amélioration significative de 4,9 % du MRR, amélioration de 1,6 % de Hits@1, amélioration de 4,4 % de Hits@10
Performance de Classification de Triplets :
Ensemble de données UMLS : Précision de 93,15 %, score F1 de 93,18 %, atteignant les meilleures performances
Ensemble de données FB15k-237N : Précision de 78,02 %, précision de 71,10 %, F1 de 80,93 %, tous les meilleurs
Ensemble de données CoDeX-S : Précision de 78,52 % la plus élevée, autres indicateurs comparables aux lignes de base fortes
Effet d'Enrichissement Sémantique :
Pour la requête (Barack Obama, /government/politician/government_positions_held..., ?) :
Sans enrichissement des connaissances : Basé sur le chevauchement lexical, Gov Position (Title) etc. sont classés en avant
Avec enrichissement des connaissances : Les concepts sémantiquement pertinents comme Person (Nationality) voient leur classement amélioré, reflétant la transition de la simple correspondance textuelle à la véritable pertinence sémantique
Sensibilité des Hyperparamètres :
Le paramètre Top-K atteint les meilleures performances à K=10 (MRR=0,471, Hit@1=0,380), trop petit (K=4) manque d'informations, trop grand (K=32) introduit du bruit.
Méthodes d'plongement : Évolution des modèles géométriques comme TransE, ComplEx vers des méthodes d'espace géométrique plus complexes comme RotE, HAKE
Méthodes GNN : PathCon, CBLiP etc. agrègent les informations de chemins multi-sauts, mais restent basées sur des représentations statiques
Méthodes LLM : KG-BERT, SimKGC etc. convertissent les triplets en séquences textuelles, mais l'interaction reste au niveau superficiel
Forte Innovativité Méthodologique : Première proposition d'un paradigme de fusion profonde au niveau des caractéristiques, dépassant les limitations de l'ajustement par préfixe traditionnel
Conception Technique Raisonnée : Le passage de messages centré sur les relations et la sélection de voisins guidée par la sémantique sont conçus de manière ingénieuse
Expériences Complètes et Exhaustives : Couvrent deux catégories de tâches (prédiction de liens et classification de triplets), validées sur plusieurs ensembles de données
Expériences d'Ablation Détaillées : Vérifient systématiquement la contribution de chaque composant
Analyse de Cas Approfondie : Démontrent l'effet de l'enrichissement sémantique par des exemples concrets
L'article cite 80 articles connexes, couvrant plusieurs domaines tels que l'plongement de graphes de connaissances, les réseaux de neurones graphiques et les grands modèles de langage, fournissant une base théorique solide pour la recherche. Les références clés incluent les méthodes classiques d'plongement KG comme TransE, RotatE, ainsi que les travaux représentatifs de fusion LLM-KG comme KG-BERT, KoPA.