Efficient Relational Context Perception for Knowledge Graph Completion
Tu, Wan, Shang et al.
Knowledge Graphs (KGs) provide a structured representation of knowledge but often suffer from challenges of incompleteness. To address this, link prediction or knowledge graph completion (KGC) aims to infer missing new facts based on existing facts in KGs. Previous knowledge graph embedding models are limited in their ability to capture expressive features, especially when compared to deeper, multi-layer models. These approaches also assign a single static embedding to each entity and relation, disregarding the fact that entities and relations can exhibit different behaviors in varying graph contexts. Due to complex context over a fact triple of a KG, existing methods have to leverage complex non-linear context encoder, like transformer, to project entity and relation into low dimensional representations, resulting in high computation cost. To overcome these limitations, we propose Triple Receptance Perception (TRP) architecture to model sequential information, enabling the learning of dynamic context of entities and relations. Then we use tensor decomposition to calculate triple scores, providing robust relational decoding capabilities. This integration allows for more expressive representations. Experiments on benchmark datasets such as YAGO3-10, UMLS, FB15k, and FB13 in link prediction and triple classification tasks demonstrate that our method performs better than several state-of-the-art models, proving the effectiveness of the integration.
academic
ज्ञान ग्राफ पूर्णता के लिए कुशल संबंधपरक संदर्भ धारणा
ज्ञान ग्राफ (KGs) संरचित ज्ञान प्रतिनिधित्व प्रदान करते हैं, लेकिन आमतौर पर अधूरेपन की समस्या से ग्रस्त होते हैं। लिंक भविष्यवाणी या ज्ञान ग्राफ पूर्णता (KGC) का लक्ष्य मौजूदा तथ्यों के आधार पर लापता नए तथ्यों का अनुमान लगाना है। मौजूदा ज्ञान ग्राफ एम्बेडिंग मॉडल अभिव्यक्तिशील विशेषताओं को कैप्चर करने की क्षमता में सीमित हैं, और प्रत्येक इकाई और संबंध को एक एकल स्थिर एम्बेडिंग प्रदान करते हैं, इस तथ्य को नज़रअंदाज़ करते हैं कि इकाइयां और संबंध विभिन्न ग्राफ संदर्भों में अलग-अलग व्यवहार प्रदर्शित कर सकते हैं। ज्ञान ग्राफ तथ्य त्रिपदों की जटिल संदर्भ के कारण, मौजूदा विधियों को इकाइयों और संबंधों को कम-आयामी प्रतिनिधित्व में प्रक्षेपित करने के लिए जटिल गैर-रैखिक संदर्भ एनकोडर (जैसे Transformer) का उपयोग करना चाहिए, जिससे उच्च कम्प्यूटेशनल लागत होती है। इन सीमाओं को दूर करने के लिए, यह पेपर त्रिपद रिसेप्टिव फील्ड धारणा (TRP) आर्किटेक्चर प्रस्तावित करता है जो अनुक्रमिक जानकारी को मॉडल करता है, इकाइयों और संबंधों की गतिशील संदर्भ सीखने को सक्षम करता है। फिर त्रिपद स्कोर की गणना के लिए टेंसर अपघटन का उपयोग किया जाता है, जो मजबूत संबंध डिकोडिंग क्षमता प्रदान करता है। यह एकीकरण अधिक अभिव्यक्तिशील प्रतिनिधित्व की अनुमति देता है। YAGO3-10, UMLS, FB15k और FB13 जैसे बेंचमार्क डेटासेट पर लिंक भविष्यवाणी और त्रिपद वर्गीकरण कार्यों पर प्रयोग दर्शाते हैं कि यह विधि कई अत्याधुनिक मॉडलों से बेहतर है।
ज्ञान ग्राफ पूर्णता (KGC) एक महत्वपूर्ण अनुसंधान समस्या है जिसका लक्ष्य ज्ञान ग्राफ में लापता तथ्यों का अनुमान लगाना है। ज्ञान ग्राफ आमतौर पर त्रिपद रूप (सिर इकाई, संबंध, पूंछ इकाई) में प्रतिनिधित्व किए जाते हैं, लेकिन वास्तविक दुनिया के ज्ञान ग्राफ में अक्सर बड़ी संख्या में लापता संबंध होते हैं, जो प्रश्नोत्तर प्रणाली, सिफारिश प्रणाली आदि अनुप्रयोगों में इसकी प्रभावशीलता को सीमित करता है।
सीमित अभिव्यक्तिशील क्षमता: पारंपरिक ज्ञान ग्राफ एम्बेडिंग विधियां मुख्य रूप से जोड़ या गुणन संचालन पर निर्भर करती हैं, जिनकी अभिव्यक्तिशील क्षमता सीमित है
स्थिर एम्बेडिंग: मौजूदा विधियां प्रत्येक इकाई और संबंध को एक एकल स्थिर एम्बेडिंग प्रदान करती हैं, विभिन्न संदर्भों में उनके अलग-अलग व्यवहार को नज़रअंदाज़ करती हैं
उच्च कम्प्यूटेशनल लागत: Transformer-आधारित विधियां हालांकि प्रभावी हैं, लेकिन स्केलेबिलिटी समस्याओं से ग्रस्त हैं, जिनकी कम्प्यूटेशनल लागत अधिक है
अपर्याप्त संदर्भ मॉडलिंग: जटिल संबंधपरक संदर्भ की प्रभावी मॉडलिंग की क्षमता की कमी
इस पेपर की मूल प्रेरणा एक ऐसी विधि डिज़ाइन करना है जो गतिशील संदर्भ जानकारी को कैप्चर कर सके और साथ ही कम्प्यूटेशनल रूप से कुशल हो। अनुक्रमिक मॉडलिंग और टेंसर अपघटन के लाभों को जोड़कर, बेहतर प्रदर्शन-दक्षता संतुलन प्राप्त किया जा सकता है।
त्रिपद रिसेप्टिव फील्ड धारणा (TRP) आर्किटेक्चर का प्रस्ताव: एक नया एनकोडर जो ज्ञान ग्राफ में अनुक्रमिक जानकारी और गतिशील संदर्भ को प्रभावी ढंग से मॉडल कर सकता है
Tucker अपघटन डिकोडर का एकीकरण: मजबूत संबंध डिकोडिंग क्षमता प्रदान करता है, कॉम्पैक्ट और अभिव्यक्तिशील संबंध संरचना प्रतिनिधित्व को सक्षम करता है
बेहतर प्रदर्शन-दक्षता संतुलन का कार्यान्वयन: Transformer जैसी जटिल विधियों की तुलना में, प्रतिस्पर्धी प्रदर्शन बनाए रखते हुए कम्प्यूटेशनल लागत में उल्लेखनीय कमी
कई बेंचमार्क डेटासेट पर SOTA परिणाम प्राप्त: लिंक भविष्यवाणी और त्रिपद वर्गीकरण कार्यों दोनों पर मौजूदा विधियों से बेहतर
ज्ञान ग्राफ में अधूरे त्रिपद (h, r, ?) या (?, r, t) दिए गए, लक्ष्य लापता पूंछ इकाई या सिर इकाई की भविष्यवाणी करना है। औपचारिक रूप से, त्रिपद (h, r, t) के लिए, मॉडल को एक स्कोरिंग फ़ंक्शन φ(h, r, t) सीखना चाहिए जो इस त्रिपद के सत्य होने की संभावना को मापता है।
गतिशील संदर्भ मॉडलिंग: TRP अनुक्रमिक मॉडलिंग तंत्र के माध्यम से इकाई और संबंध एम्बेडिंग को विभिन्न संदर्भों के अनुसार गतिशील रूप से समायोजित करने में सक्षम बनाता है
कुशल पुनरावर्ती गणना: पुनरावर्ती सूत्रों के माध्यम से कुशल अनुमान को लागू करता है, Transformer की द्विघात जटिलता से बचता है
कारणात्मकता संरक्षण: डिज़ाइन अनुमान प्रक्रिया में कारणात्मकता को संरक्षित करता है, मॉडल को RNN की तरह कुशलतापूर्वक अनुमान लगाने में सक्षम बनाता है
टेंसर अपघटन एकीकरण: Tucker अपघटन पैरामीटर-कुशल और अभिव्यक्तिशील संबंध मॉडलिंग क्षमता प्रदान करता है
इकाई एम्बेडिंग: t-SNE दृश्य विभिन्न श्रेणियों की इकाइयों को स्पष्ट रूप से अलग किए गए क्लस्टर बनाते हुए दिखाता है
संबंध एम्बेडिंग: सममित संबंध और उनके व्युत्क्रम संबंध घनिष्ठ रूप से समूहित होते हैं, असममित संबंध अधिक बिखरे हुए होते हैं, जो विभिन्न शब्दार्थ संबंधों की TRP की प्रभावी मॉडलिंग को प्रदर्शित करता है
यह पेपर अनुक्रमिक मॉडलिंग और टेंसर अपघटन के लाभों को जोड़ता है, शुद्ध अनुवाद मॉडल की तुलना में मजबूत अभिव्यक्तिशील क्षमता है, जटिल तंत्रिका नेटवर्क मॉडल की तुलना में उच्च दक्षता है, प्रदर्शन और दक्षता के बीच बेहतर संतुलन प्राप्त करता है।
पेपर ज्ञान ग्राफ पूर्णता क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
TransE (Bordes et al., 2013): अनुवाद मॉडल का अग्रणी कार्य
TuckER (Balažević et al., 2019): ज्ञान ग्राफ में Tucker अपघटन का अनुप्रयोग
CoKE (Wang et al., 2019): Transformer-आधारित संदर्भपूर्ण ज्ञान ग्राफ एम्बेडिंग
RWKV (Peng et al., 2023): इस पेपर के TRP आर्किटेक्चर की प्रेरणा का स्रोत
समग्र मूल्यांकन: यह ज्ञान ग्राफ पूर्णता का एक उच्च-गुणवत्ता वाला पेपर है, जो प्रस्तावित TRP आर्किटेक्चर तकनीकी रूप से महत्वपूर्ण नवाचार है, प्रयोग व्यापक रूप से सत्यापित हैं, प्रदर्शन और दक्षता के बीच अच्छा संतुलन प्राप्त किया गया है। पेपर का मुख्य योगदान अनुक्रमिक मॉडलिंग के विचार को ज्ञान ग्राफ पूर्णता में लाना है, जो इस क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है। हालांकि सैद्धांतिक विश्लेषण और बड़े पैमाने पर सत्यापन में सुधार की गुंजाइश है, लेकिन समग्र रूप से यह एक मूल्यवान अनुसंधान कार्य है।