DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
academic
DELE: Incrustaciones Deductivas EL++ para Completación de Bases de Conocimiento
Este artículo aborda las limitaciones de los métodos de incrustación de ontologías para la lógica descriptiva EL++ en tareas de completación de bases de conocimiento, proponiendo el método DELE (Incrustaciones Deductivas EL++). Aunque los métodos geométricos existentes pueden generar explícitamente modelos de ontologías, presentan dos problemas críticos: (1) no pueden distinguir entre enunciados no demostrables y enunciados refutables, pudiendo utilizar enunciados implicados como muestras negativas; (2) no aprovechan suficientemente la clausura deductiva de la ontología para identificar enunciados inferidos pero no asertados. Este artículo mejora el rendimiento de la completación de bases de conocimiento mediante el diseño de nuevas funciones de pérdida negativa y métodos de evaluación que aprovechan efectivamente la clausura deductiva.
La incrustación de ontologías tiene como objetivo mapear clases, roles e individuos de una ontología al espacio Rn para calcular similitud entre entidades o inferir nuevos axiomas. Para la lógica descriptiva EL++, existen varios métodos de incrustación geométrica basados en optimización, como ELEmbeddings, ELBE y Box2EL.
Problema de Selección de Muestras Negativas: Los métodos existentes pueden seleccionar aleatoriamente muestras negativas que incluyan enunciados verdaderos implicados en la ontología como ejemplos negativos, afectando la calidad del entrenamiento del modelo.
Aprovechamiento Insuficiente de la Clausura Deductiva: No se considera adecuadamente la clausura deductiva de la ontología, es decir, el conjunto de todos los enunciados derivables, lo que impide distinguir efectivamente entre conocimiento ya inferido y conocimiento no asertado.
Limitaciones en Métodos de Evaluación: Los métodos de evaluación existentes provienen principalmente de tareas de completación de grafos de conocimiento, sin considerar las relaciones de implicación ricas presentes en ontologías.
La completación de bases de conocimiento es una tarea importante que requiere predecir axiomas que deberían agregarse a la base de conocimiento pero aún no están representados. Para bases de conocimiento formalizadas, esto incluye dos tipos: razonamiento deductivo (predicción de axiomas implicados) y razonamiento inductivo (predicción de axiomas nuevos no implicados). Este artículo tiene como objetivo mejorar los métodos de incrustación geométrica mediante un mejor aprovechamiento de la clausura deductiva.
Propuesta de Funciones de Pérdida Negativa Considerando la Clausura Deductiva: Se diseñaron nuevas funciones de pérdida negativa para todas las formas estándar de EL++, evitando utilizar enunciados implicados como muestras negativas.
Diseño de Algoritmo Rápido de Aproximación para Cálculo de Clausura Deductiva: Se propuso un algoritmo correcto para calcular la clausura deductiva de teorías EL++, mejorando la selección de muestras negativas durante el entrenamiento.
Formulación de Método de Evaluación Considerando la Clausura Deductiva: Se diseñaron nuevas métricas de evaluación para tareas de completación de bases de conocimiento que pueden distinguir el rendimiento predictivo entre axiomas implicados y no implicados.
Extensión de Múltiples Métodos de Incrustación Geométrica: Se aplicaron las mejoras a tres métodos representativos: ELEmbeddings, ELBE y Box2EL, demostrando la generalidad del enfoque.
La tarea de completación de bases de conocimiento se define como: dado una ontología EL++T, predecir nuevos axiomas que deberían agregarse a T. La tarea se subdivide además en:
Completación Deductiva: Predicción de axiomas en la clausura deductiva T⊢ pero no explícitamente asertados en T.
Completación Inductiva: Predicción de axiomas nuevos no presentes en la clausura deductiva.
Se proponen dos algoritmos para calcular aproximaciones de la clausura deductiva:
Algoritmo 1: Basado en axiomas explícitamente representados en la ontología, utiliza reglas de inferencia para derivar axiomas implicados. Por ejemplo:
A ⊓ B ⊑ E, A' ⊑ A, B' ⊑ B, E ⊑ E'
─────────────────────────────────────
A' ⊓ B' ⊑ E'
Algoritmo 2: Basado en nombres de conceptos y roles arbitrarios, añade axiomas lógicamente necesarios, como A⊓⊥⊑E.
Importancia de la Clausura Deductiva: Aprovechar adecuadamente la clausura deductiva puede mejorar significativamente el rendimiento de los métodos de incrustación geométrica.
Impacto de la Calidad de Muestras Negativas: Evitar utilizar enunciados implicados como muestras negativas es crucial para el entrenamiento del modelo.
Mejora en Métodos de Evaluación: Los métodos de evaluación que consideran la clausura deductiva pueden reflejar más precisamente la capacidad de completación de bases de conocimiento del modelo.
Generalidad del Método: La estrategia de mejora es aplicable a múltiples métodos de incrustación geométrica.
Complejidad Computacional: El cálculo de la clausura deductiva puede presentar problemas de eficiencia en ontologías a gran escala.
Algoritmo de Aproximación: El algoritmo de clausura deductiva propuesto es correcto pero no completo.
Limitaciones de Evaluación: Las métricas de evaluación existentes aún se basan en clasificación de axiomas individuales, sin considerar similitud semántica.
Rango de Aplicabilidad: Se enfoca principalmente en EL++, con extensibilidad limitada a lógicas descriptivas más expresivas.
Identificación Precisa del Problema: Identifica con precisión los problemas clave en métodos existentes respecto a selección de muestras negativas y aprovechamiento de clausura deductiva.
Diseño Razonable del Método: Las funciones de pérdida negativa y estrategias de filtrado propuestas tienen motivación teórica suficiente.
Experimentación Completa: Valida la efectividad del método en múltiples conjuntos de datos y tareas, incluyendo análisis de visualización.
Contribución Teórica: Proporciona un algoritmo correcto para cálculo de clausura deductiva con valor teórico.
Generalidad Fuerte: La estrategia de mejora es aplicable a múltiples métodos de incrustación geométrica.
Mejora de Rendimiento Limitada: En algunas tareas, la mejora es marginal, posiblemente insuficiente para justificar la complejidad adicional.
Costo Computacional: El cálculo de clausura deductiva y filtrado de muestras negativas aumentan el tiempo de entrenamiento, pero el artículo no analiza suficientemente esta sobrecarga.
Conjuntos de Datos de Referencia: Los conjuntos de datos utilizados tienen escala relativamente pequeña, con efectividad en aplicaciones a gran escala por verificar.
Comparación Insuficiente: Falta comparación con métodos recientes de completación de bases de conocimiento basados en LLM.
El artículo cita 50 referencias relacionadas, cubriendo trabajos importantes en lógica descriptiva, incrustación de ontologías, completación de grafos de conocimiento y campos relacionados, proporcionando una base teórica sólida para la investigación.