DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
यह पेपर विवरणात्मक तर्क EL++ के लिए ज्ञान आधार पूर्णता कार्य में ऑन्टोलॉजी एम्बेडिंग विधियों की सीमाओं को संबोधित करता है। DELE (演绎 EL++ एम्बेडिंग) विधि प्रस्तावित की गई है। मौजूदा ज्यामितीय एम्बेडिंग विधियां, हालांकि ऑन्टोलॉजी मॉडल को स्पष्ट रूप से उत्पन्न कर सकती हैं, दो महत्वपूर्ण समस्याओं से ग्रस्त हैं: (1) अप्रमाणित कथनों और खंडन योग्य कथनों के बीच अंतर नहीं कर सकते, संभवतः निहित कथनों को नकारात्मक नमूनों के रूप में लेते हैं; (2) अनुमानित लेकिन अप्रमाणित कथनों की पहचान करने के लिए演绎बंद का पर्याप्त उपयोग नहीं करते हैं। यह पेपर नए नकारात्मक हानि कार्य और मूल्यांकन विधियों को डिजाइन करके,演绎बंद का प्रभावी ढंग से उपयोग करके ज्ञान आधार पूर्णता प्रदर्शन में सुधार करता है।
ऑन्टोलॉजी एम्बेडिंग का उद्देश्य ऑन्टोलॉजी में वर्गों, भूमिकाओं और व्यक्तियों को Rn स्थान में मैप करना है, ताकि संस्थाओं के बीच समानता की गणना की जा सके या नए स्वयंसिद्ध अनुमान लगाए जा सकें। EL++ विवरणात्मक तर्क के लिए, ELEmbeddings, ELBE और Box2EL जैसी कई अनुकूलन-आधारित ज्यामितीय एम्बेडिंग विधियां मौजूद हैं।
नकारात्मक नमूना चयन समस्या: मौजूदा विधियां नकारात्मक नमूने यादृच्छिक रूप से चुनते समय, ऑन्टोलॉजी में निहित वास्तविक कथनों को गलती से नकारात्मक उदाहरणों के रूप में ले सकते हैं, जिससे मॉडल प्रशिक्षण गुणवत्ता प्रभावित होती है
演绎बंद उपयोग अपर्याप्त: ऑन्टोलॉजी के演绎बंद पर पर्याप्त विचार नहीं किया जाता है, अर्थात् सभी व्युत्पन्न कथनों का समुच्चय, जिससे पहले से अनुमानित और अप्रमाणित ज्ञान के बीच प्रभावी ढंग से अंतर नहीं किया जा सकता है
मूल्यांकन विधि सीमाएं: मौजूदा मूल्यांकन विधियां मुख्य रूप से ज्ञान ग्राफ पूर्णता कार्य से आती हैं, ऑन्टोलॉजी में समृद्ध निहितार्थ संबंधों पर विचार नहीं करती हैं
ज्ञान आधार पूर्णता एक महत्वपूर्ण कार्य है जिसके लिए ऐसे स्वयंसिद्धों की भविष्यवाणी की आवश्यकता है जो ज्ञान आधार में जोड़े जाने चाहिए लेकिन अभी तक प्रतिनिधित्व नहीं किए गए हैं। औपचारिक ज्ञान आधारों के लिए, इसमें演绎तर्क (निहित स्वयंसिद्धों की भविष्यवाणी) और आगमनात्मक तर्क (नए गैर-निहित स्वयंसिद्धों की भविष्यवाणी) दोनों प्रकार शामिल हैं। यह पेपर演绎बंद का बेहतर उपयोग करके ज्यामितीय एम्बेडिंग विधियों में सुधार करने का लक्ष्य रखता है।
演绎बंद पर विचार करने वाले नकारात्मक हानि कार्य का प्रस्ताव: सभी EL++ मानक रूपों के लिए नए नकारात्मक हानि कार्य डिजाइन किए गए हैं, जो निहित कथनों को नकारात्मक नमूनों के रूप में लेने से बचते हैं
तेजी से अनुमानित演绎बंद गणना एल्गोरिथ्म डिजाइन: EL++ सिद्धांत演绎बंद की गणना के लिए एक ध्वनि एल्गोरिथ्म प्रस्तावित किया गया है, जिसका उपयोग प्रशिक्षण प्रक्रिया में नकारात्मक नमूना चयन में सुधार के लिए किया जाता है
演绎बंद पर विचार करने वाली मूल्यांकन विधि का निर्माण: ज्ञान आधार पूर्णता कार्य के लिए नई मूल्यांकन मेट्रिक्स डिजाइन की गई हैं, जो निहित और गैर-निहित स्वयंसिद्धों की भविष्यवाणी प्रदर्शन को अलग कर सकते हैं
कई ज्यामितीय एम्बेडिंग विधियों का विस्तार: सुधार को ELEmbeddings, ELBE और Box2EL तीन प्रतिनिधि विधियों पर लागू किया गया है, जिससे सामान्यता सिद्ध होती है
ज्ञान आधार पूर्णता कार्य को इस प्रकार परिभाषित किया गया है: एक EL++ ऑन्टोलॉजी T दी गई है, T में जोड़े जाने वाले नए स्वयंसिद्धों की भविष्यवाणी करें। कार्य को आगे विभाजित किया जा सकता है:
演绎पूर्णता:演绎बंद T⊢ में लेकिन T में स्पष्ट रूप से अप्रमाणित स्वयंसिद्धों की भविष्यवाणी करना
आगमनात्मक पूर्णता:演绎बंद में नहीं आने वाले नए स्वयंसिद्धों की भविष्यवाणी करना
EL++ स्वयंसिद्धों को 7 रूपों में मानकीकृत किया जा सकता है (तालिका 1 देखें):
GCI0: A⊑B
GCI1: A⊓B⊑E
GCI2: A⊑∃r.B
GCI3: ∃r.A⊑B
GCI0-BOT: A⊑⊥
GCI1-BOT: A⊓B⊑⊥
GCI3-BOT: ∃r.A⊑⊥
####演绎बंद एल्गोरिथ्म
演绎बंद के अनुमान की गणना के लिए दो एल्गोरिदम प्रस्तावित किए गए हैं:
एल्गोरिथ्म 1: ऑन्टोलॉजी में स्पष्ट रूप से प्रतिनिधित किए गए स्वयंसिद्धों के आधार पर, अनुमान नियमों का उपयोग करके निहित स्वयंसिद्धों को व्युत्पन्न करें। उदाहरण के लिए:
A ⊓ B ⊑ E, A' ⊑ A, B' ⊑ B, E ⊑ E'
─────────────────────────────────────
A' ⊓ B' ⊑ E'
एल्गोरिथ्म 2: मनमानी अवधारणाओं और भूमिका नामों के आधार पर, तार्किक रूप से आवश्यक स्वयंसिद्धों को जोड़ें, जैसे A⊓⊥⊑E।
1.演绎बंद गणना के लिए अधिक कुशल एल्गोरिदम विकसित करना
2. शब्दार्थ समानता पर विचार करने वाली मूल्यांकन मेट्रिक्स डिजाइन करना
3. अधिक अभिव्यक्तिशील विवरणात्मक तर्क तक विस्तार करना
4. अधिक ज्ञान आधार पूर्णता बेंचमार्क डेटासेट बनाना
पेपर में विवरणात्मक तर्क, ऑन्टोलॉजी एम्बेडिंग, ज्ञान ग्राफ पूर्णता और अन्य संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए 50 संदर्भों का हवाला दिया गया है, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है।