DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
academic
DELE : Plongements Déductifs EL++ pour la Complétion de Bases de Connaissances
Cet article propose la méthode DELE (Deductive EL++ Embeddings) pour remédier aux limitations des méthodes de plongement d'ontologies en logique de description EL++ dans les tâches de complétion de bases de connaissances. Bien que les méthodes géométriques existantes puissent générer explicitement des modèles d'ontologies, elles présentent deux problèmes critiques : (1) l'incapacité à distinguer les énoncés non prouvables des énoncés réfutables, risquant de traiter les énoncés impliqués comme des exemples négatifs ; (2) l'utilisation insuffisante de la fermeture déductive de l'ontologie pour identifier les énoncés déduits mais non affirmés. Cet article améliore les performances de complétion de bases de connaissances en concevant de nouvelles fonctions de perte négative et des méthodes d'évaluation qui exploitent efficacement la fermeture déductive.
Le plongement d'ontologies vise à mapper les classes, rôles et individus d'une ontologie dans l'espace Rn afin de calculer la similarité entre entités ou de déduire de nouveaux axiomes. Pour la logique de description EL++, plusieurs méthodes géométriques basées sur l'optimisation existent, telles que ELEmbeddings, ELBE et Box2EL.
Problème de sélection des exemples négatifs : Lors de la sélection aléatoire d'exemples négatifs, les méthodes existantes peuvent traiter à tort les énoncés vrais impliqués par l'ontologie comme des exemples négatifs, affectant la qualité de l'entraînement du modèle
Utilisation insuffisante de la fermeture déductive : La fermeture déductive, c'est-à-dire l'ensemble de tous les énoncés dérivables, n'est pas suffisamment prise en compte, empêchant une distinction efficace entre les connaissances déduites et les connaissances non affirmées
Limitations des méthodes d'évaluation : Les méthodes d'évaluation existantes proviennent principalement des tâches de complétion de graphes de connaissances et ne tiennent pas compte des relations d'implication riches présentes dans les ontologies
La complétion de bases de connaissances est une tâche importante qui nécessite de prédire les axiomes qui devraient être ajoutés à la base de connaissances mais qui ne sont pas encore représentés. Pour les bases de connaissances formalisées, cela inclut deux types : le raisonnement déductif (prédiction des axiomes impliqués) et le raisonnement inductif (prédiction de nouveaux axiomes non impliqués). Cet article vise à améliorer les méthodes géométriques de plongement en exploitant mieux la fermeture déductive.
Proposition de fonctions de perte négative tenant compte de la fermeture déductive : Conception de nouvelles fonctions de perte négative pour toutes les formes standard EL++, évitant de traiter les énoncés impliqués comme des exemples négatifs
Conception d'un algorithme rapide d'approximation du calcul de la fermeture déductive : Proposition d'un algorithme correct pour calculer la fermeture déductive théorique de EL++, utilisé pour améliorer la sélection des exemples négatifs lors de l'entraînement
Formulation de méthodes d'évaluation tenant compte de la fermeture déductive : Conception de nouvelles métriques d'évaluation pour les tâches de complétion de bases de connaissances, capable de distinguer les performances de prédiction entre axiomes impliqués et non impliqués
Extension de plusieurs méthodes géométriques de plongement : Application des améliorations à trois méthodes représentatives (ELEmbeddings, ELBE et Box2EL), démontrant l'universalité de l'approche
La tâche de complétion de bases de connaissances est définie comme suit : étant donnée une ontologie EL++T, prédire les nouveaux axiomes qui devraient être ajoutés à T. La tâche peut être subdivisée en :
Complétion déductive : Prédiction des axiomes dans la fermeture déductive T⊢ mais non explicitement affirmés dans T
Complétion inductive : Prédiction de nouveaux axiomes non présents dans la fermeture déductive
Cet article propose deux algorithmes pour calculer une approximation de la fermeture déductive :
Algorithme 1 : Basé sur les axiomes explicitement représentés dans l'ontologie, utilisant des règles d'inférence pour déduire les axiomes impliqués. Par exemple :
A ⊓ B ⊑ E, A' ⊑ A, B' ⊑ B, E ⊑ E'
─────────────────────────────────────
A' ⊓ B' ⊑ E'
Algorithme 2 : Basé sur des noms de concepts et de rôles arbitraires, ajoutant les axiomes logiquement nécessaires, tels que A⊓⊥⊑E.
Importance de la fermeture déductive : L'exploitation complète de la fermeture déductive peut améliorer significativement les performances des méthodes géométriques de plongement
Impact de la qualité des exemples négatifs : Éviter de traiter les énoncés impliqués comme des exemples négatifs est crucial pour l'entraînement du modèle
Amélioration des méthodes d'évaluation : Les méthodes d'évaluation tenant compte de la fermeture déductive peuvent mieux refléter la capacité de complétion de bases de connaissances du modèle
Universalité de la méthode : Les stratégies d'amélioration s'appliquent à plusieurs méthodes géométriques de plongement
Complexité de calcul : Le calcul de la fermeture déductive peut présenter des problèmes d'efficacité sur les ontologies à grande échelle
Algorithme d'approximation : L'algorithme de fermeture déductive proposé est correct mais incomplet
Limitations d'évaluation : Les métriques d'évaluation existantes restent basées sur le classement d'axiomes individuels, sans tenir compte de la similarité sémantique
Portée d'application : Principalement orienté vers EL++, avec une extensibilité limitée aux logiques de description plus expressives
Identification précise du problème : Identification exacte des problèmes clés des méthodes existantes en matière de sélection d'exemples négatifs et d'utilisation de la fermeture déductive
Conception méthodologique rationnelle : Les fonctions de perte négative et les stratégies de filtrage proposées sont théoriquement bien motivées
Expériences complètes : Validation de l'efficacité de la méthode sur plusieurs ensembles de données et tâches, incluant l'analyse de visualisation
Contributions théoriques : Fourniture d'un algorithme correct pour le calcul de la fermeture déductive, ayant une valeur théorique
Forte universalité : Les stratégies d'amélioration s'appliquent à plusieurs méthodes géométriques de plongement
Améliorations de performance limitées : Les améliorations sur certaines tâches sont modestes, pouvant ne pas justifier la complexité supplémentaire
Surcharge de calcul : Le calcul de la fermeture déductive et le filtrage des exemples négatifs augmentent le temps d'entraînement, mais l'article n'analyse pas suffisamment cette surcharge
Ensembles de données de référence : Les ensembles de données utilisés sont relativement petits, l'efficacité des applications à grande échelle reste à vérifier
Comparaisons insuffisantes : Manque de comparaisons avec les méthodes récentes de complétion de bases de connaissances basées sur les LLM
L'article cite 50 articles connexes, couvrant les travaux importants dans les domaines de la logique de description, des plongements d'ontologies et de la complétion de graphes de connaissances, fournissant une base théorique solide pour la recherche.