DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion
Mashkova, Zhapa-Camacho, Hoehndorf
Ontology embeddings map classes, roles, and individuals in ontologies into $\mathbb{R}^n$, and within $\mathbb{R}^n$ similarity between entities can be computed or new axioms inferred. For ontologies in the Description Logic $\mathcal{EL}^{++}$, several optimization-based embedding methods have been developed that explicitly generate models of an ontology. However, these methods suffer from some limitations; they do not distinguish between statements that are unprovable and provably false, and therefore they may use entailed statements as negatives. Furthermore, they do not utilize the deductive closure of an ontology to identify statements that are inferred but not asserted. We evaluated a set of embedding methods for $\mathcal{EL}^{++}$ ontologies, incorporating several modifications that aim to make use of the ontology deductive closure. In particular, we designed novel negative losses that account both for the deductive closure and different types of negatives and formulated evaluation methods for knowledge base completion. We demonstrate that our embedding methods improve over the baseline ontology embedding in the task of knowledge base or ontology completion.
본 논문은 기술 논리(Description Logic) EL++의 온톨로지 임베딩 방법이 지식 기반 완성 작업에서 갖는 한계를 다루며, DELE(연역적 EL++ 임베딩) 방법을 제안한다. 기존의 기하학적 임베딩 방법은 온톨로지 모델을 명시적으로 생성할 수 있지만 두 가지 핵심 문제가 있다: (1) 증명 불가능한 진술과 반박 가능한 진술을 구별할 수 없어 함축된 진술을 음성 샘플로 취급할 수 있음, (2) 온톨로지의 연역적 폐포(deductive closure)를 충분히 활용하여 추론되었으나 명시적으로 단언되지 않은 진술을 식별하지 못함. 본 논문은 새로운 음성 손실 함수와 평가 방법을 설계하여 연역적 폐포를 효과적으로 활용함으로써 지식 기반 완성 성능을 개선한다.
온톨로지 임베딩은 온톨로지의 클래스, 역할(role) 및 개체를 Rn 공간에 매핑하여 엔티티 간 유사성을 계산하거나 새로운 공리를 추론하는 것을 목표로 한다. EL++ 기술 논리의 경우, ELEmbeddings, ELBE, Box2EL 등 최적화 기반의 여러 기하학적 임베딩 방법이 존재한다.
지식 기반 완성은 지식 기반에 추가되어야 하지만 아직 표현되지 않은 공리를 예측하는 중요한 작업이다. 형식화된 지식 기반의 경우, 이는 연역 추론(함축된 공리 예측)과 귀납 추론(새로운 비함축 공리 예측) 두 가지 유형을 포함한다. 본 논문은 연역적 폐포를 더 잘 활용하여 기하학적 임베딩 방법을 개선하는 것을 목표로 한다.