Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
सिमेंटिक-कंडीशन ट्यूनिंग: ज्ञान ग्राफ पूर्णता के लिए बड़े भाषा मॉडल के साथ ग्राफ संदर्भ का संलयन
यह पेपर Semantic-Condition Tuning (SCT) प्रस्तावित करता है, जो ज्ञान ग्राफ पूर्णता कार्यों में ज्ञान ग्राफ और बड़े भाषा मॉडल के संलयन समस्या को हल करने के लिए एक नई ज्ञान इंजेक्शन प्रतिमान है। परंपरागत उपसर्ग ट्यूनिंग विधियां ज्ञान एम्बेडिंग को सरलता से पाठ इनपुट के साथ जोड़ती हैं, यह उथला संलयन ज्ञान ग्राफ में समृद्ध संबंध शब्दार्थ को नजरअंदाज करता है और LLM पर भारी अंतर्निहित तर्क का बोझ डालता है। SCT में दो मुख्य मॉड्यूल हैं: सिमेंटिक ग्राफ मॉड्यूल स्थानीय ग्राफ पड़ोस से संदर्भ-जागरूक सिमेंटिक शर्तें निकालने के लिए ग्राफ न्यूरल नेटवर्क का उपयोग करता है; कंडीशन-अनुकूली संलयन मॉड्यूल दो पैरामीट्रिक प्रक्षेपकों के माध्यम से पाठ एम्बेडिंग को अनुकूली रूप से मॉड्यूलेट करता है, गहरे, विशेषता-स्तर और ज्ञान-जागरूक इंटरैक्शन को सक्षम करता है।
ज्ञान ग्राफ अधूरापन: वास्तविक दुनिया के ज्ञान ग्राफ स्वाभाविक रूप से अधूरे हैं, जो डाउनस्ट्रीम अनुप्रयोगों में उनकी उपयोगिता को सीमित करता है
उथले संलयन की सीमाएं: मौजूदा उपसर्ग ट्यूनिंग विधियां केवल सरल संयोजन संचालन करती हैं, ज्ञान ग्राफ की संरचनात्मक जानकारी का पूरी तरह से उपयोग नहीं कर सकतीं
संबंध शब्दार्थ की गतिशीलता: संबंध का अर्थ अपने आसपास के शब्दार्थ संदर्भ के अनुसार गतिशील रूप से बदलता है, जैसा कि चित्र 1 में दिखाया गया है कि "treats" संबंध विभिन्न संदर्भों में विभिन्न उपचार तंत्र को दर्शाता है
SCT फ्रेमवर्क प्रस्तावित करना: संदर्भ-जागरूक और अनुकूली एम्बेडिंग संलयन को एकीकृत करने वाला पहला सिमेंटिक कंडीशन ट्यूनिंग फ्रेमवर्क, जो मौजूदा सरल उपसर्ग ट्यूनिंग संयोजन की सीमाओं को दूर करता है
सिमेंटिक ग्राफ मॉड्यूल: एक नई संबंध-केंद्रित संदेश पारण तंत्र प्रस्तावित करता है, पड़ोसी चयन ज्ञान-वर्धित संबंध विवरणों के स्पष्ट सिमेंटिक समानता स्कोर द्वारा निर्देशित है
कंडीशन-अनुकूली संलयन मॉड्यूल: एक संलयन तंत्र प्रस्तुत करता है जो इनपुट पाठ एम्बेडिंग के सीधे विशेषता-स्तर affine रूपांतरण सीखने के लिए सिमेंटिक शर्तों का उपयोग करता है, ग्राफ संदर्भ का गहरा सहयोगी एकीकरण प्राप्त करता है
प्रदर्शन सत्यापन: कई बेंचमार्क में SCT का अत्याधुनिक प्रदर्शन और उच्च पैरामीटर दक्षता प्रदर्शित करता है
ज्ञान ग्राफ G को त्रिपद सेट T = {(h, r, t) | h, t ∈ E, r ∈ R} के रूप में परिभाषित किया गया है, जहां E और R क्रमशः इकाई और संबंध सेट का प्रतिनिधित्व करते हैं। ज्ञान ग्राफ पूर्णता कार्य दिए गए त्रिपद में लापता तत्व का अनुमान लगाना है, जैसे क्वेरी (h, r, ?) के लिए पूंछ इकाई t की भविष्यवाणी करना। LLM-आधारित KGC में, इस कार्य को पाठ जनन समस्या के रूप में औपचारिक किया जाता है।
सिमेंटिक वर्धन प्रभाव:
क्वेरी (Barack Obama, /government/politician/government_positions_held..., ?) के उदाहरण के साथ:
ज्ञान वर्धन के बिना: शब्दकोशीय ओवरलैप के आधार पर, Gov Position (Title) आदि उच्च रैंक में आते हैं
ज्ञान वर्धन के साथ: Person (Nationality) जैसी सिमेंटिक रूप से प्रासंगिक अवधारणाएं रैंकिंग में सुधार करती हैं, उथले पाठ मिलान से वास्तविक सिमेंटिक प्रासंगिकता में परिवर्तन को दर्शाता है
हाइपरपैरामीटर संवेदनशीलता:
Top-K पैरामीटर K=10 पर सर्वोत्तम प्रदर्शन प्राप्त करता है (MRR=0.471, Hit@1=0.380), बहुत छोटा (K=4) अपर्याप्त जानकारी, बहुत बड़ा (K=32) शोर का परिचय देता है।
पेपर ने 80 संबंधित संदर्भों को उद्धृत किया है, जो ज्ञान ग्राफ एम्बेडिंग, ग्राफ न्यूरल नेटवर्क, बड़े भाषा मॉडल आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करता है, अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है। मुख्य संदर्भ साहित्य में TransE, RotatE आदि शास्त्रीय KG एम्बेडिंग विधियां, साथ ही KG-BERT, KoPA आदि LLM-KG संलयन के प्रतिनिधि कार्य शामिल हैं।