2025-11-22T04:10:16.342290

Efficient Relational Context Perception for Knowledge Graph Completion

Tu, Wan, Shang et al.

Knowledge Graphs (KGs) provide a structured representation of knowledge but often suffer from challenges of incompleteness. To address this, link prediction or knowledge graph completion (KGC) aims to infer missing new facts based on existing facts in KGs. Previous knowledge graph embedding models are limited in their ability to capture expressive features, especially when compared to deeper, multi-layer models. These approaches also assign a single static embedding to each entity and relation, disregarding the fact that entities and relations can exhibit different behaviors in varying graph contexts. Due to complex context over a fact triple of a KG, existing methods have to leverage complex non-linear context encoder, like transformer, to project entity and relation into low dimensional representations, resulting in high computation cost. To overcome these limitations, we propose Triple Receptance Perception (TRP) architecture to model sequential information, enabling the learning of dynamic context of entities and relations. Then we use tensor decomposition to calculate triple scores, providing robust relational decoding capabilities. This integration allows for more expressive representations. Experiments on benchmark datasets such as YAGO3-10, UMLS, FB15k, and FB13 in link prediction and triple classification tasks demonstrate that our method performs better than several state-of-the-art models, proving the effectiveness of the integration.

academic

Efficient Relational Context Perception for Knowledge Graph Completion

基本信息

论文ID: 2501.00397
标题: Efficient Relational Context Perception for Knowledge Graph Completion
作者: Wenkai Tu, Guojia Wan, Zhengchun Shang, Bo Du (武汉大学)
分类: cs.LG cs.AI cs.CL
发表时间: 2024年12月31日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2501.00397

摘要

知识图谱(KGs)提供了结构化的知识表示，但通常存在不完整性问题。链接预测或知识图谱补全(KGC)旨在基于现有事实推断缺失的新事实。现有的知识图谱嵌入模型在捕获表达性特征方面能力有限，且为每个实体和关系分配单一静态嵌入，忽略了实体和关系在不同图上下文中可能表现出不同行为的事实。由于知识图谱事实三元组的复杂上下文，现有方法必须利用复杂的非线性上下文编码器(如Transformer)将实体和关系投影到低维表示中，导致高计算成本。为克服这些限制，本文提出了三元组感受野感知(TRP)架构来建模序列信息，实现实体和关系动态上下文的学习。然后使用张量分解计算三元组分数，提供强大的关系解码能力。该集成允许更具表达性的表示。在YAGO3-10、UMLS、FB15k和FB13等基准数据集上的链接预测和三元组分类任务实验表明，该方法优于多个最先进的模型。

研究背景与动机

问题定义

知识图谱补全(KGC)是一个重要的研究问题，旨在推断知识图谱中缺失的事实。知识图谱通常表示为三元组形式(头实体，关系，尾实体)，但现实世界的知识图谱往往存在大量缺失关系，限制了其在问答系统、推荐系统等应用中的效果。

现有方法的局限性

表达能力有限：传统的知识图谱嵌入方法主要依赖加法或乘法操作，表达能力有限
静态嵌入：现有方法为每个实体和关系分配单一静态嵌入，忽略了它们在不同上下文中的不同行为
高计算成本：基于Transformer的方法虽然效果好，但存在可扩展性问题，计算成本高
上下文建模不足：缺乏对复杂关系上下文的有效建模能力

研究动机

本文的核心动机是设计一个既能捕获动态上下文信息，又具有计算效率的知识图谱补全方法。通过结合序列建模和张量分解的优势，实现更好的性能-效率平衡。

核心贡献

提出了三元组感受野感知(TRP)架构：一种新颖的编码器，能够有效建模知识图谱中的序列信息和动态上下文
集成Tucker分解解码器：提供强大的关系解码能力，实现紧凑而富有表达力的关系结构表示
实现了更好的性能-效率平衡：相比Transformer等复杂方法，在保持竞争性能的同时显著降低计算成本
在多个基准数据集上取得SOTA结果：在链接预测和三元组分类任务上均优于现有方法

方法详解

任务定义

给定知识图谱中的不完整三元组(h, r, ?)或(?, r, t)，目标是预测缺失的尾实体或头实体。形式化地，对于三元组(h, r, t)，模型需要学习一个评分函数φ(h, r, t)来衡量该三元组为真的可能性。

模型架构

1. 三元组感受野感知(TRP)编码器

TRP架构由多个残差块组成，每个块包含两个关键子模块：

时间混合模块(Time Mixing)：

ot = Wo · (σ(rt) ⊙ wkvt)
rt = Wr · (μr ⊙ xt + (1-μr) ⊙ xt-1)

其中wkvt通过以下递归方式计算：

wkvt = (at-1 + e^(u+kt) ⊙ vt) / (bt-1 + e^(u+kt))
at = e^(-w) ⊙ at-1 + e^kt ⊙ vt  
bt = e^(-w) ⊙ bt-1 + e^kt

通道混合模块(Channel Mixing)：

r't = Wr' · (μ'r x't + (1-μ'r)x't-1)
k't = Wk' · (μ'k x't + (1-μ'k)x't-1)  
o't = σ(r't) · (Wv' ⊙ max(k't, 0)²)

模块集成：

x' = x + Dropout(TimeMixing(LayerNorm(x)))
x'' = x' + Dropout(ChannelMixing(LayerNorm(x')))

2. Tucker分解解码器

使用Tucker分解作为解码器来计算三元组分数：

φ(h, r, t) = Wc ×1 ẽh ×2 ẽr ×3 et

其中Wc ∈ R^(d×d×d)是可学习的核心张量，×n表示n-模张量积。

技术创新点

动态上下文建模：TRP通过序列建模机制使实体和关系嵌入能够根据不同上下文动态调整
高效的递归计算：通过递归公式实现高效推理，避免了Transformer的二次复杂度
因果性保持：设计保证了推理过程中的因果性，使模型能够像RNN一样高效推理
张量分解集成：Tucker分解提供了参数高效且表达力强的关系建模能力

实验设置

数据集

使用四个标准基准数据集：

数据集	实体数	关系数	训练集	验证集	测试集
UMLS	135	46	5,126	652	661
FB15k	14,951	1,345	483,142	50,000	59,071
YAGO3-10	123,182	37	1,079,040	5,000	5,000
FB13	75,043	13	316,232	11,816	47,466

评价指标

平均倒数排名(MRR)：MRR = 1/|S| Σ(1/ranki)
Hits@k：正确答案排在前k位的比例
准确率：用于三元组分类任务

对比方法

仅使用三元组的方法：TransE、DistMult、ComplEx、RotatE、TuckER、ConvE、CoKE、HAKE、HousE

使用上下文的方法：Neural-LP、R-GCN、Rlogic、ChatRule

实现细节

嵌入维度：{64, 96, 128, 192, 256}
TRP块数量：{2, 4, 6, 8}
Dropout率：{0.2, 0.3, 0.4, 0.5}
优化器：Adam
学习率：0.0005-0.01
批大小：512
最大训练轮数：500

实验结果

主要结果

链接预测结果：

方法	FB15k			YAGO3-10			UMLS
	MRR	H@1	H@10	MRR	H@1	H@10	MRR	H@1	H@10
TransE	0.38	23.1	47.1	0.30	21.8	47.5	0.69	52.3	89.7
CoKE	0.85	82.6	90.6	0.55	47.5	67.5	0.94	90.7	99.7
Ours	0.85	81.2	90.3	0.57	50.1	70.0	0.95	90.4	99.9