DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
academic
DELE: Deduktive EL++ Einbettungen für die Wissensbasisvervollständigung
Dieses Paper adressiert die Einschränkungen von Ontologie-Einbettungsmethoden für die Beschreibungslogik EL++ bei der Wissensbasisvervollständigung und schlägt die DELE-Methode (Deductive EL++ Embeddings) vor. Obwohl bestehende geometrische Einbettungsmethoden explizit Ontologie-Modelle generieren können, weisen sie zwei kritische Probleme auf: (1) Sie können nicht zwischen unbeweisbaren und widerlegbaren Aussagen unterscheiden und können implizierte Aussagen möglicherweise als negative Beispiele verwenden; (2) Sie nutzen den deduktiven Abschluss der Ontologie nicht ausreichend, um abgeleitete, aber nicht explizit behauptete Aussagen zu identifizieren. Dieses Paper verbessert die Wissensbasisvervollständigung durch die Gestaltung neuer negativer Verlustfunktionen und Bewertungsmethoden, die den deduktiven Abschluss effektiv nutzen.
Die Ontologie-Einbettung zielt darauf ab, Klassen, Rollen und Individuen in einer Ontologie in den Raum Rn abzubilden, um die Ähnlichkeit zwischen Entitäten zu berechnen oder neue Axiome abzuleiten. Für die Beschreibungslogik EL++ existieren bereits mehrere optimierungsbasierte geometrische Einbettungsmethoden wie ELEmbeddings, ELBE und Box2EL.
Problem der Negativbeispielauswahl: Bei der zufälligen Auswahl von Negativbeispielen können bestehende Methoden echte Aussagen, die in der Ontologie impliziert sind, fälschlicherweise als negative Beispiele behandeln und die Trainingsqualität des Modells beeinträchtigen
Unzureichende Nutzung des deduktiven Abschlusses: Der deduktive Abschluss der Ontologie, d.h. die Menge aller ableitbaren Aussagen, wird nicht ausreichend berücksichtigt, was es unmöglich macht, zwischen abgeleiteten und nicht behaupteten Wissen effektiv zu unterscheiden
Einschränkungen der Bewertungsmethoden: Bestehende Bewertungsmethoden stammen hauptsächlich aus Wissensgraph-Vervollständigungsaufgaben und berücksichtigen nicht die reichen Implikationsbeziehungen in Ontologien
Die Wissensbasisvervollständigung ist eine wichtige Aufgabe, die die Vorhersage von Axiomen erfordert, die der Wissensbasis hinzugefügt werden sollten, aber noch nicht dargestellt sind. Für formalisierte Wissensbases umfasst dies zwei Arten: deduktive Inferenz (Vorhersage implizierter Axiome) und induktive Inferenz (Vorhersage neuer, nicht implizierter Axiome). Dieses Paper zielt darauf ab, geometrische Einbettungsmethoden durch bessere Nutzung des deduktiven Abschlusses zu verbessern.
Vorschlag von Negativverlustfunktionen unter Berücksichtigung des deduktiven Abschlusses: Neue Negativverlustfunktionen für alle EL++-Standardformen wurden entworfen, um zu vermeiden, dass implizierte Aussagen als negative Beispiele verwendet werden
Entwurf eines schnellen Näherungsalgorithmus zur Berechnung des deduktiven Abschlusses: Ein korrekter Algorithmus zur Berechnung des theoretischen deduktiven Abschlusses von EL++ wurde vorgeschlagen, um die Negativbeispielauswahl während des Trainings zu verbessern
Formulierung von Bewertungsmethoden unter Berücksichtigung des deduktiven Abschlusses: Neue Bewertungsmetriken für Wissensbasisvervollständigungsaufgaben wurden entworfen, die die Vorhersageleistung für implizierte und nicht implizierte Axiome unterscheiden können
Erweiterung mehrerer geometrischer Einbettungsmethoden: Die Verbesserungen wurden auf drei repräsentative Methoden (ELEmbeddings, ELBE und Box2EL) angewendet und ihre Allgemeingültigkeit nachgewiesen
Die Wissensbasisvervollständigungsaufgabe wird wie folgt definiert: Gegeben eine EL++-Ontologie T, neue Axiome vorhersagen, die zu T hinzugefügt werden sollten. Die Aufgabe kann weiter unterteilt werden in:
Deduktive Vervollständigung: Vorhersage von Axiomen im deduktiven Abschluss T⊢, die nicht explizit in T behauptet sind
Induktive Vervollständigung: Vorhersage neuer Axiome, die nicht im deduktiven Abschluss enthalten sind
Dieses Paper schlägt zwei Algorithmen vor, um eine Näherung des deduktiven Abschlusses zu berechnen:
Algorithmus 1: Basierend auf explizit in der Ontologie dargestellten Axiomen werden Inferenzregeln verwendet, um implizierte Axiome abzuleiten. Beispiel:
A ⊓ B ⊑ E, A' ⊑ A, B' ⊑ B, E ⊑ E'
─────────────────────────────────────
A' ⊓ B' ⊑ E'
Algorithmus 2: Basierend auf beliebigen Konzept- und Rollennamen werden logisch notwendige Axiome hinzugefügt, wie z.B. A⊓⊥⊑E.
Bedeutung des deduktiven Abschlusses: Die vollständige Nutzung des deduktiven Abschlusses kann die Leistung geometrischer Einbettungsmethoden erheblich verbessern
Auswirkung der Negativbeispielqualität: Die Vermeidung, implizierte Aussagen als Negativbeispiele zu verwenden, ist entscheidend für das Modelltraining
Verbesserung der Bewertungsmethoden: Bewertungsmethoden, die den deduktiven Abschluss berücksichtigen, können die Fähigkeit des Modells zur Wissensbasisvervollständigung genauer widerspiegeln
Allgemeingültigkeit der Methode: Die Verbesserungsstrategien sind auf mehrere geometrische Einbettungsmethoden anwendbar
Rechenkomplexität: Die Berechnung des deduktiven Abschlusses kann bei großen Ontologien Effizienzprobleme aufweisen
Näherungsalgorithmen: Die vorgeschlagenen Algorithmen für den deduktiven Abschluss sind korrekt, aber nicht vollständig
Bewertungseinschränkungen: Bestehende Bewertungsmetriken basieren immer noch auf einzelnem Axiom-Ranking und berücksichtigen keine semantische Ähnlichkeit
Anwendungsbereich: Hauptsächlich auf EL++ ausgerichtet, begrenzte Erweiterbarkeit auf ausdrucksstärkere Beschreibungslogiken
Genaue Problemidentifikation: Präzise Identifikation kritischer Probleme bestehender Methoden bei der Negativbeispielauswahl und Nutzung des deduktiven Abschlusses
Angemessener Methodenentwurf: Die vorgeschlagenen Negativverlustfunktionen und Filterungsstrategien sind theoretisch gut motiviert
Umfassende Experimente: Validierung der Methodeneffektivität auf mehreren Datensätzen und Aufgaben, einschließlich Visualisierungsanalyse
Theoretischer Beitrag: Bereitstellung eines korrekten Algorithmus zur Berechnung des deduktiven Abschlusses mit theoretischem Wert
Starke Allgemeingültigkeit: Verbesserungsstrategien sind auf mehrere geometrische Einbettungsmethoden anwendbar
Begrenzte Leistungsverbesserung: Bei einigen Aufgaben sind die Verbesserungen gering und möglicherweise nicht ausreichend, um die zusätzliche Komplexität zu rechtfertigen
Rechnerischer Overhead: Die Berechnung des deduktiven Abschlusses und die Filterung von Negativbeispielen erhöhen die Trainingszeit, aber das Paper analysiert diesen Overhead nicht ausreichend
Benchmark-Datensätze: Die verwendeten Datensätze sind relativ klein, die Effektivität bei großflächigen Anwendungen bleibt zu überprüfen
Unzureichende Vergleiche: Fehlender Vergleich mit neuesten LLM-basierten Wissensbasisvervollständigungsmethoden
Das Paper zitiert 50 verwandte Arbeiten, die wichtige Arbeiten in den Bereichen Beschreibungslogik, Ontologie-Einbettung und Wissensgraph-Vervollständigung abdecken und eine solide theoretische Grundlage für die Forschung bieten.