DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
تقدم هذه الورقة طريقة DELE (تضمينات استنتاجية EL++) لمعالجة القيود في طرق تضمين الأنطولوجيا للمنطق الوصفي EL++ في مهام إكمال قاعدة المعرفة. على الرغم من أن الطرق الهندسية الموجودة يمكنها توليد نماذج أنطولوجيا صريحة، إلا أنها تعاني من مشكلتين رئيسيتين: (1) عدم القدرة على التمييز بين البيانات غير القابلة للإثبات والبيانات القابلة للدحض، مما قد يؤدي إلى استخدام البيانات المستنتجة كعينات سالبة؛ (2) عدم الاستفادة الكافية من الإغلاق الاستنتاجي للأنطولوجيا لتحديد البيانات المستنتجة لكن غير المؤكدة. تحسّن هذه الورقة أداء إكمال قاعدة المعرفة من خلال تصميم دوال خسارة سالبة جديدة وطرق تقييم فعالة تستفيد من الإغلاق الاستنتاجي.
يهدف تضمين الأنطولوجيا إلى تعيين الفئات والأدوار والأفراد في الأنطولوجيا إلى فضاء Rn لحساب التشابه بين الكيانات أو استنتاج بديهيات جديدة. بالنسبة للمنطق الوصفي EL++، توجد عدة طرق تضمين هندسية قائمة على التحسين، مثل ELEmbeddings و ELBE و Box2EL وغيرها.
مشكلة اختيار العينات السالبة: عند اختيار العينات السالبة عشوائياً، قد تعتبر الطرق الموجودة البيانات الحقيقية المستنتجة من الأنطولوجيا كأمثلة سالبة، مما يؤثر على جودة تدريب النموذج
الاستفادة غير الكافية من الإغلاق الاستنتاجي: لم يتم النظر الكافي في الإغلاق الاستنتاجي للأنطولوجيا، أي مجموعة جميع البيانات القابلة للاشتقاق، مما يؤدي إلى عدم القدرة على التمييز الفعال بين المعرفة المستنتجة والمعرفة غير المؤكدة
قيود طرق التقييم: تأتي طرق التقييم الموجودة بشكل أساسي من مهام إكمال الرسم البياني للمعرفة، ولا تأخذ في الاعتبار العلاقات الاستنتاجية الغنية في الأنطولوجيا
إكمال قاعدة المعرفة مهمة مهمة تتطلب التنبؤ بالبديهيات التي يجب إضافتها إلى قاعدة المعرفة لكنها لم تُمثّل بعد. بالنسبة لقواعس المعرفة الرسمية، يشمل ذلك نوعين من الاستدلال: الاستدلال الاستنتاجي (التنبؤ بالبديهيات المستنتجة) والاستدلال الاستقرائي (التنبؤ بالبديهيات الجديدة غير المستنتجة). تهدف هذه الورقة إلى تحسين الطرق الهندسية للتضمين من خلال الاستفادة بشكل أفضل من الإغلاق الاستنتاجي.
اقتراح دوال خسارة سالبة تأخذ في الاعتبار الإغلاق الاستنتاجي: تم تصميم دوال خسارة سالبة جديدة لجميع أشكال EL++ القياسية، مما يتجنب استخدام البيانات المستنتجة كعينات سالبة
تصميم خوارزمية سريعة لحساب الإغلاق الاستنتاجي التقريبي: اقتراح خوارزمية سليمة لحساب الإغلاق الاستنتاجي النظري لـ EL++، لاستخدامها في تحسين اختيار العينات السالبة أثناء التدريب
وضع طريقة تقييم تأخذ في الاعتبار الإغلاق الاستنتاجي: تصميم مقاييس تقييم جديدة لمهام إكمال قاعدة المعرفة، يمكنها التمييز بين أداء التنبؤ بالبديهيات المستنتجة وغير المستنتجة
توسيع عدة طرق تضمين هندسية: تطبيق التحسينات على ثلاث طرق تمثيلية: ELEmbeddings و ELBE و Box2EL، مما يثبت عمومية الطريقة
تُعرّف مهمة إكمال قاعدة المعرفة على أنها: بالنظر إلى أنطولوجيا EL++ معينة T، التنبؤ بالبديهيات الجديدة التي يجب إضافتها إلى T. يمكن تقسيم المهمة بشكل أكبر إلى:
الإكمال الاستنتاجي: التنبؤ بالبديهيات الموجودة في الإغلاق الاستنتاجي T⊢ لكنها غير مؤكدة صراحة في T
الإكمال الاستقرائي: التنبؤ بالبديهيات الجديدة غير الموجودة في الإغلاق الاستنتاجي