Efficient Relational Context Perception for Knowledge Graph Completion
Tu, Wan, Shang et al.
Knowledge Graphs (KGs) provide a structured representation of knowledge but often suffer from challenges of incompleteness. To address this, link prediction or knowledge graph completion (KGC) aims to infer missing new facts based on existing facts in KGs. Previous knowledge graph embedding models are limited in their ability to capture expressive features, especially when compared to deeper, multi-layer models. These approaches also assign a single static embedding to each entity and relation, disregarding the fact that entities and relations can exhibit different behaviors in varying graph contexts. Due to complex context over a fact triple of a KG, existing methods have to leverage complex non-linear context encoder, like transformer, to project entity and relation into low dimensional representations, resulting in high computation cost. To overcome these limitations, we propose Triple Receptance Perception (TRP) architecture to model sequential information, enabling the learning of dynamic context of entities and relations. Then we use tensor decomposition to calculate triple scores, providing robust relational decoding capabilities. This integration allows for more expressive representations. Experiments on benchmark datasets such as YAGO3-10, UMLS, FB15k, and FB13 in link prediction and triple classification tasks demonstrate that our method performs better than several state-of-the-art models, proving the effectiveness of the integration.
توفر الرسوم البيانية للمعرفة (KGs) تمثيلاً منظماً للمعرفة، لكنها تعاني عادة من مشاكل عدم الاكتمال. يهدف التنبؤ بالروابط أو إكمال الرسم البياني للمعرفة (KGC) إلى استنتاج حقائق جديدة مفقودة بناءً على الحقائق الموجودة. تتمتع نماذج تضمين الرسم البياني للمعرفة الحالية بقدرة محدودة على التقاط الميزات التعبيرية، وتخصص تضمين ثابت واحد لكل كيان وعلاقة، مما يتجاهل حقيقة أن الكيانات والعلاقات قد تظهر سلوكيات مختلفة في سياقات رسوم بيانية مختلفة. نظراً للسياق المعقد لثلاثيات حقائق الرسم البياني للمعرفة، يجب على الطرق الموجودة الاستفادة من أجهزة ترميز السياق غير الخطية المعقدة (مثل Transformer) لإسقاط الكيانات والعلاقات إلى تمثيلات منخفضة الأبعاد، مما يؤدي إلى تكاليف حسابية عالية. للتغلب على هذه القيود، تقترح هذه الورقة معمارية مجال الاستقبال الثلاثي الإدراك (TRP) لنمذجة المعلومات التسلسلية وتحقيق التعلم الديناميكي للسياق للكيانات والعلاقات. ثم يتم استخدام تحليل الموتر لحساب درجات الثلاثيات، مما يوفر قدرة فك تشفير علائقية قوية. يسمح هذا التكامل بتمثيلات أكثر تعبيراً. تُظهر التجارب على مهام التنبؤ بالروابط وتصنيف الثلاثيات على مجموعات البيانات المعيارية YAGO3-10 و UMLS و FB15k و FB13 أن الطريقة تتفوق على عدة نماذج متقدمة.
إكمال الرسم البياني للمعرفة (KGC) هي مشكلة بحثية مهمة تهدف إلى استنتاج الحقائق المفقودة في الرسم البياني للمعرفة. يتم تمثيل الرسوم البيانية للمعرفة عادة في شكل ثلاثيات (كيان رأس، علاقة، كيان ذيل)، لكن الرسوم البيانية للمعرفة في العالم الحقيقي غالباً ما تحتوي على علاقات مفقودة كثيرة، مما يحد من فعاليتها في التطبيقات مثل أنظمة الإجابة على الأسئلة وأنظمة التوصيات.
الدافع الأساسي لهذه الورقة هو تصميم طريقة لإكمال الرسم البياني للمعرفة يمكنها التقاط معلومات السياق الديناميكي مع الحفاظ على الكفاءة الحسابية. من خلال الجمع بين مزايا النمذجة التسلسلية وتحليل الموتر، يتم تحقيق توازن أفضل بين الأداء والكفاءة.
بالنظر إلى ثلاثية غير مكتملة في الرسم البياني للمعرفة (h, r, ?) أو (?, r, t)، الهدف هو التنبؤ بكيان الذيل أو كيان الرأس المفقود. رسمياً، بالنسبة للثلاثية (h, r, t)، يجب على النموذج تعلم دالة تسجيل φ(h, r, t) لقياس احتمالية أن تكون هذه الثلاثية صحيحة.
تضمينات الكيانات: يُظهر التصور t-SNE أن كيانات الفئات المختلفة تشكل مجموعات منفصلة واضحة
تضمينات العلاقات: العلاقات المتماثلة وعلاقاتها العكسية مجمعة بإحكام، والعلاقات غير المتماثلة موزعة بشكل أكثر تشتتاً، مما يعكس نمذجة TRP الفعالة للعلاقات الدلالية المختلفة
تجمع هذه الورقة بين مزايا النمذجة التسلسلية وتحليل الموتر. مقارنة بنماذج الترجمة البحتة، تتمتع بقدرة تعبيرية أقوى. مقارنة بنماذج الشبكات العصبية المعقدة، تتمتع بكفاءة أعلى، مما يحقق توازناً أفضل بين الأداء والكفاءة.
تستشهد الورقة بالأدبيات المهمة في مجال إكمال الرسم البياني للمعرفة، بما في ذلك:
TransE (Bordes et al., 2013): العمل الرائد في نماذج الترجمة
TuckER (Balažević et al., 2019): تطبيق تحليل Tucker في الرسوم البيانية للمعرفة
CoKE (Wang et al., 2019): تضمين الرسم البياني للمعرفة السياقي المستند إلى Transformer
RWKV (Peng et al., 2023): مصدر الإلهام لمعمارية TRP في هذه الورقة
التقييم الإجمالي: هذه ورقة عالية الجودة في مجال إكمال الرسم البياني للمعرفة، حيث تقترح معمارية TRP ذات ابتكار تقني كبير، وتحقق تحقق تجريبي شامل، وتحقق توازناً جيداً بين الأداء والكفاءة. تكمن المساهمة الرئيسية للورقة في إدخال أفكار النمذجة التسلسلية إلى إكمال الرسم البياني للمعرفة، مما يوفر اتجاهاً بحثياً جديداً لهذا المجال. على الرغم من وجود مجال للتحسين في التحليل النظري والتحقق على نطاق واسع، إلا أن العمل البحثي ذو قيمة عموماً.