2025-11-14T19:31:12.107456

Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems

Lyu, Wang, Zhang et al.

This paper designs and implements an explainable recommendation model that integrates knowledge graphs with structure-aware attention mechanisms. The model is built on graph neural networks and incorporates a multi-hop neighbor aggregation strategy. By integrating the structural information of knowledge graphs and dynamically assigning importance to different neighbors through an attention mechanism, the model enhances its ability to capture implicit preference relationships. In the proposed method, users and items are embedded into a unified graph structure. Multi-level semantic paths are constructed based on entities and relations in the knowledge graph to extract richer contextual information. During the rating prediction phase, recommendations are generated through the interaction between user and target item representations. The model is optimized using a binary cross-entropy loss function. Experiments conducted on the Amazon Books dataset validate the superior performance of the proposed model across various evaluation metrics. The model also shows good convergence and stability. These results further demonstrate the effectiveness and practicality of structure-aware attention mechanisms in knowledge graph-enhanced recommendation.

academic

دمج الانتباه الواعي للبنية والرسوم البيانية للمعرفة في أنظمة التوصيات القابلة للتفسير

المعلومات الأساسية

معرّف الورقة: 2510.10109
العنوان: دمج الانتباه الواعي للبنية والرسوم البيانية للمعرفة في أنظمة التوصيات القابلة للتفسير
المؤلفون: Shuangquan Lyu (جامعة كارنيجي ميلون)، Ming Wang (جامعة Trine)، Huajun Zhang (جامعة Syracuse)، Xiaoxuan Sun (باحث مستقل)، Junjiang Lin (جامعة تورنتو)، Jiasen Zheng (جامعة Northwestern)
التصنيف: cs.IR (استرجاع المعلومات)
تاريخ النشر/المؤتمر: نسخة أولية لعام 2024
رابط الورقة: https://arxiv.org/abs/2510.10109

الملخص

تقدم هذه الورقة نموذج توصيات قابل للتفسير يدمج الرسوم البيانية للمعرفة مع آلية الانتباه الواعية للبنية. يتم بناء النموذج على أساس الشبكات العصبية الرسومية ويستخدم استراتيجية تجميع الجيران متعددة القفزات. من خلال دمج المعلومات الهيكلية من الرسوم البيانية للمعرفة وتخصيص الأهمية النسبية للجيران المختلفين بشكل ديناميكي عبر آلية الانتباه، يعزز النموذج قدرته على التقاط العلاقات الضمنية للتفضيلات. في الطريقة المقترحة، يتم تضمين المستخدمين والعناصر في بنية رسومية موحدة، مع بناء مسارات دلالية متعددة المستويات بناءً على الكيانات والعلاقات في الرسم البياني للمعرفة لاستخراج معلومات سياقية أغنى. في مرحلة التنبؤ بالتقييم، يتم إنشاء التوصيات من خلال التفاعل بين تمثيلات المستخدم والعنصر المستهدف. يتم تحسين النموذج باستخدام دالة خسارة الإنتروبيا الثنائية. تتحقق التجارب التي أجريت على مجموعة بيانات Amazon Books من الأداء المتفوق للنموذج المقترح عبر مقاييس التقييم المختلفة، مع إظهار النموذج تقاربًا جيدًا واستقرارًا.

خلفية البحث والدافع

وصف المشكلة

في عصر الانفجار المعلوماتي، يواجه المستخدمون مشكلة الإرهاق المعلوماتي غير المسبوقة. تظهر الطرق التقليدية للتوصيات مثل التصفية التعاونية والطرق القائمة على المحتوى قيودًا كبيرة في التعامل مع المشاكل المتعلقة بالندرة والأبعاد العالية والبدء البارد.

أهمية البحث

تلعب أنظمة التوصيات دورًا حاسمًا في منصات التجارة الإلكترونية ومنصات الفيديو ووسائل التواصل الاجتماعي. مع التطور السريع للتعلم العميق والنماذج اللغوية الكبيرة، تتطور أنظمة التوصيات نحو معماريات أكثر ذكاءً وتعقيدًا. أصبح دمج المعرفة الخارجية لتحسين أداء التوصيات محور البحث الرئيسي.

قيود الطرق الموجودة

دمج الرسوم البيانية للمعرفة غير كافٍ: مجرد دمج الرسوم البيانية للمعرفة لا يكفي لتحرير قدراتها بالكامل في أنظمة التوصيات
عدم كفاية التمييز بين أهمية العلاقات: لا تساهم جميع الاتصالات بشكل متساوٍ في عملية التوصية، حيث تحمل بعض مسارات الارتباط معلومات أكثر معنى من غيرها
نقص القابلية للتفسير: لا يحتاج المستخدمون فقط إلى توصيات عالية الجودة، بل يحتاجون أيضًا إلى الشفافية وشرح أسباب التوصيات

دافع البحث

تصميم نموذج توصيات قابل للتفسير يجمع بين الرسوم البيانية للمعرفة وآلية الانتباه الواعية للبنية هو ضرورة عملية وخطوة طبيعية في التطور الذكي لأنظمة التوصيات. يساهم هذا البحث في تطوير أنظمة توصيات أكثر شمولاً وكفاءة وموثوقية.

المساهمات الأساسية

اقتراح معمارية توصيات جديدة قابلة للتفسير: دمج عميق لأول مرة لآلية الانتباه الواعية للبنية مع الرسوم البيانية للمعرفة، مما يحقق تحسينًا مزدوجًا في الدقة والقابلية للتفسير
تصميم استراتيجية تجميع الجيران متعددة القفزات: من خلال تخصيص الأهمية النسبية بشكل ديناميكي، يتم التقاط الفعال لمسارات العلاقات عالية القيمة في الرسوم البيانية للمعرفة
تنفيذ إطار عمل تحسين من طرف إلى طرف: بناء بنية رسومية موحدة للمستخدم والعنصر، مع دعم بناء المسارات الدلالية متعددة المستويات واستخراج المعلومات السياقية
التحقق من فعالية الطريقة: تحقيق تحسينات أداء كبيرة على مجموعة بيانات Amazon Books، متفوقة على جميع طرق الخط الأساسي عبر جميع مقاييس التقييم

شرح الطريقة التفصيلي

تعريف المهمة

بالنظر إلى مجموعة المستخدمين U، مجموعة العناصر I، مجموعة الكيانات E والعلاقات R في الرسم البياني للمعرفة، الهدف هو التنبؤ بتقييم تفضيل المستخدم u للعنصر i وتقديم مسارات توصيات قابلة للتفسير. يتم تمثيل كل ثلاثية كـ (h,r,t) ∈ E×R×E، حيث يمثل h الكيان الرأس، r يمثل نوع العلاقة، و t يمثل الكيان الذيل.

معمارية النموذج

1. بناء البنية الرسومية

تعيين المستخدمين والعناصر إلى عقد في البنية الرسومية
ربط الكيانات المساعدة المختلفة (الفئات والسمات والعلامات التجارية وما إلى ذلك) عبر الرسم البياني للمعرفة
بناء معلومات الجيران متعددة القفزات لتشكيل ارتباطات دلالية غنية

2. آلية الانتباه الواعية للبنية

بالنسبة لمجموعة العقد المجاورة N(i) للعقدة i، يتم حساب وزن الانتباه α_ij لكل عقدة مجاورة j∈N(i):

α_ij = exp(LeakyRELU(a^T[Wh_i||Wh_j])) / Σ_{k∈N(i)} exp(LeakyRELU(a^T[Wh_i||Wh_k]))

حيث:

h_i يمثل تمثيل التضمين الأولي للعقدة i
W مصفوفة الأوزان القابلة للتعلم
a متجه الانتباه
|| يمثل عملية ربط المتجهات

3. تجميع المعلومات وتعلم التمثيل

يتم تجميع معلومات الجيران من خلال أوزان الانتباه لبناء تمثيل تضمين مشترك للمستخدم والعنصر. يتم تمثيل المستخدم u والعنصر i كـ e_u و e_i على التوالي، وتستخدم دالة التقييم النهائية شكل الضرب الداخلي:

y_ui = e_u^T · e_i

4. تصميم دالة الخسارة

يتم استخدام خسارة الإنتروبيا الثنائية للتدريب:

L = -Σ_{(u,i)∈D} [y_ui log y'_ui + (1-y_ui) log(1-y'_ui)]

حيث D يمثل مجموعة بيانات التدريب، و y_ui ∈ {0,1} هي قيمة التسمية لما إذا كان المستخدم u قد تفاعل مع العنصر i.

نقاط الابتكار التقني

تخصيص الأهمية النسبية الديناميكي: يتم التعلم التلقائي لدرجة تأثير الجيران المختلفين على العقدة المركزية من خلال آلية الانتباه الواعية للبنية
المسارات الدلالية متعددة المستويات: بناء مسارات دلالية متعددة المستويات تربط المستخدم والعنصر المستهدف بناءً على الرسم البياني للمعرفة
القابلية للتفسير من طرف إلى طرف: لا يقتصر الأمر على تحسين دقة التوصيات، بل يوفر شروحات توصيات من خلال مسارات قابلة للتتبع

إعداد التجارب

مجموعات البيانات

استخدام مجموعة بيانات Amazon Books كأساس تجريبي:

مصدر البيانات: سجلات التفاعل الفعلية للمستخدمين من منصة التجارة الإلكترونية عبر الإنترنت
محتوى البيانات: يتضمن التقييمات وطوابع زمنية التعليقات وبيانات وصفية للمنتجات
معلومات الرسم البياني للمعرفة: فئات المنتجات والعلامات التجارية والمؤلفون والكيانات والعلاقات الأخرى
المعالجة المسبقة: إزالة السجلات الشاذة والكيانات منخفضة التكرار، مع الاحتفاظ فقط بعينات التغذية الراجعة الإيجابية بدرجة 4 فما فوق

مقاييس التقييم

Precision@10: نسبة العناصر ذات الصلة بين أفضل 10 توصيات
Recall@10: نسبة العناصر ذات الصلة المسترجعة بين أفضل 10 توصيات من إجمالي العناصر ذات الصلة
NDCG@10: الكسب التراكمي المخصوم المعياري مع الأخذ في الاعتبار موضع الترتيب
MAP: متوسط الدقة المتوسطة

طرق المقارنة

SGCN-SRec: توصيات اجتماعية قائمة على شبكة عصبية رسومية قائمة على المشاعر
SA-MPF: إطار عمل التنبؤ بالقناع الواعي للحالة
Csrec: توصيات متسلسلة من منظور سببي
DNS-Rec: توصيات البحث عن البنية العصبية الواعية للبيانات
SAQ-Rec: توصيات محاذاة رضا المستخدم بناءً على تعليقات الاستبيان
Sim-Rec: توصيات متسلسلة للبدء البارد مع دمج تشابه العناصر
Linrec: آلية الانتباه الخطي للتوصيات المتسلسلة طويلة الأجل

تفاصيل التنفيذ

نطاق معدل التعلم: 0.001-0.004
عدد فترات التدريب: 100+ حقبة
خوارزمية التحسين: الانحدار التدريجي باستخدام خسارة الإنتروبيا الثنائية

نتائج التجارب

النتائج الرئيسية

الطريقة	Precision@10	Recall@10	NDCG@10	MAP
SGCN-SRec	0.284	0.395	0.362	0.219
SA-MPF	0.301	0.411	0.374	0.231
Csrec	0.292	0.403	0.368	0.225
DNS-Rec	0.307	0.417	0.381	0.239
SAQ-Rec	0.315	0.426	0.388	0.247
Sim-Rec	0.298	0.407	0.370	0.228
Linrec	0.293	0.382	0.347	0.207
طريقتنا	0.332	0.443	0.403	0.261

الاكتشافات الرئيسية:

تحقيق أفضل أداء عبر جميع مقاييس التقييم
وصول Precision@10 إلى 0.332 و Recall@10 إلى 0.443، متفوقة بشكل كبير على طرق الخط الأساسي
NDCG@10 بقيمة 0.403 و MAP بقيمة 0.261، مما يدل على جودة ترتيب ممتازة

تحليل حساسية المعاملات الفائقة

معدل التعلم	Precision@10	Recall@10	NDCG@10	MAP
0.004	0.301	0.418	0.376	0.234
0.003	0.319	0.434	0.392	0.249
0.002	0.327	0.440	0.399	0.256
0.001	0.332	0.443	0.403	0.261

نتائج التحليل:

لمعدل التعلم تأثير كبير على أداء النموذج
معدل التعلم الأعلى (0.004) يؤدي إلى عدم استقرار التدريب
أفضل معدل تعلم هو 0.001، حيث يحقق النموذج أداءً مثاليًا

تحليل التقارب

وفقًا لرسم بياني انخفاض دالة الخسارة:

في أول 50 حقبة من التدريب، تنخفض الخسارة بسرعة، مع التقاط النموذج السريع للميزات الأساسية
في مراحل التدريب اللاحقة، تصبح منحنى الخسارة تدريجيًا أكثر استقرارًا، مع تقليل كبير في تقلبات السعة
يتقارب الفرق بين خسارة التدريب وخسارة التحقق ويستقر، مما يشير إلى تقارب جيد للنموذج وعدم الإفراط في التدريب

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

توصيات الشبكات العصبية الرسومية: استخدام GNN لالتقاط بنى العلاقات المعقدة والارتباطات الدلالية
توصيات معززة بالرسوم البيانية للمعرفة: استخدام المعرفة الخارجية للتخفيف من مشاكل الندرة والبدء البارد
آليات الانتباه: تخصيص أوزان أهمية نسبية ديناميكية لمعلومات مختلفة
التوصيات القابلة للتفسير: توفير الشفافية والقابلية للفهم لقرارات التوصيات

مزايا هذه الورقة مقارنة بالأعمال ذات الصلة

دمج مبتكر: دمج عميق لأول مرة لآلية الانتباه الواعية للبنية مع الرسوم البيانية للمعرفة
تحسين من طرف إلى طرف: تصميم معمارية موحدة يدعم التدريب المشترك
أهداف مزدوجة: تحسين الدقة والقابلية للتفسير في نفس الوقت
التحقق التجريبي: التحقق من فعالية الطريقة على مجموعات بيانات حقيقية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

يمكن لآلية الانتباه الواعية للبنية أن تحدد بشكل فعال العلاقات عالية القيمة في الرسوم البيانية للمعرفة
تحسن استراتيجية تجميع الجيران متعددة القفزات بشكل كبير من قدرة التقاط المعلومات الدلالية
تحقق الطريقة المقترحة تحسينات كبيرة في كل من الدقة والقابلية للتفسير
يظهر النموذج قدرة تقارب جيدة وقدرة تعميم

القيود

التعقيد الحسابي: يزيد تجميع الجيران متعددة القفزات وحساب الانتباه من تعقيد النموذج
الاعتماد على البيانات: تعتمد أداء النموذج على جودة واكتمال الرسم البياني للمعرفة
قابلية التوسع: تحتاج قابلية التوسع على بنى رسومية كبيرة إلى مزيد من التحقق
التكيف الديناميكي: القدرة المحدودة على التكيف مع تفضيلات المستخدم المتغيرة ديناميكيًا

الاتجاهات المستقبلية

نمذجة الرسوم البيانية الديناميكية: استكشاف تأثير تطور البنية على نمذجة اهتمامات المستخدم
دمج الاستدلال السببي: دمج آليات الاستدلال السببي لتحسين قابلية التكيف لاستراتيجيات التوصيات
دمج التعلم المعزز: تحسين قابلية التكيف لاستراتيجيات التوصيات في السيناريوهات متعددة الأهداف
النقل عبر المجالات: دراسة قدرة النموذج على النقل بين المجالات المختلفة

التقييم المتعمق

المزايا

قوة الابتكار التقني: يتمتع الدمج العميق لآلية الانتباه الواعية للبنية مع الرسوم البيانية للمعرفة بالجدة
تصميم تجريبي شامل: يتضمن تجارب مقارنة شاملة وتحليل المعاملات الفائقة والتحقق من التقارب
تحسن الأداء الكبير: تحقيق تحسينات واضحة عبر جميع مقاييس التقييم
القيمة العملية العالية: يمكن تطبيقها على سيناريوهات توصيات متعددة مثل التجارة الإلكترونية ووسائل التواصل الاجتماعي
القابلية للتفسير القوية: توفير شروحات توصيات من خلال مسارات دلالية، مما يعزز ثقة المستخدم

أوجه القصور

تحليل النفقات الحسابية غير كافٍ: يفتقد إلى تحليل تفصيلي لتعقيد الوقت والمساحة
مجموعة بيانات واحدة: التحقق فقط على مجموعة بيانات Amazon Books، مع الحاجة إلى مزيد من الإثبات للقابلية للتعميم
غياب التجارب الاستئصالية: يفتقد إلى تجارب استئصالية تفصيلية لتحليل المساهمة المحددة لكل مكون
تقييم القابلية للتفسير: يفتقد إلى التقييم الكمي لجودة الشروحات المولدة
اختيار طرق المقارنة: بعض طرق الخط الأساسي نسبيًا قديمة، مع نقص المقارنة مع أحدث طرق SOTA

التأثير

المساهمة الأكاديمية: توفير مسار تقني جديد لتعزيز التوصيات بالرسوم البيانية للمعرفة
القيمة العملية: تتمتع الطريقة بجدوى تنفيذ هندسية جيدة
الأهمية الإرشادية: توفير مثال لتطبيق آلية الانتباه الواعية للبنية في أنظمة التوصيات
إمكانية التطور: توضع أساسًا لأبحاث التوصيات القابلة للتفسير في المستقبل

السيناريوهات القابلة للتطبيق

توصيات التجارة الإلكترونية: توصيات المنتجات حيث تكون المعلومات المهيكلة مثل الفئات والعلامات التجارية غنية
توصيات المحتوى: نمذجة العلاقات بين الموضوعات والمؤلفين للأخبار والفيديو وغيرها
التوصيات الاجتماعية: النمذجة المشتركة لشبكات المستخدمين الاجتماعية ورسوم البيانات للاهتمامات
التوصيات الكثيفة المعرفة: سيناريوهات مثل أوراق البحث الأكاديمي والمستندات المهنية التي تتطلب فهمًا دلاليًا عميقًا

المراجع

تستشهد الورقة بـ 31 مرجعًا ذا صلة، تغطي مجالات متعددة مثل أنظمة التوصيات والشبكات العصبية الرسومية والرسوم البيانية للمعرفة وآليات الانتباه، مما يوفر أساسًا نظريًا وتقنيًا قويًا للبحث.

التقييم الشامل: تظهر هذه الورقة أداءً ممتازًا من حيث الابتكار التقني والتحقق التجريبي، مما يقدم مساهمة قيمة لتطور أنظمة التوصيات القابلة للتفسير. على الرغم من وجود بعض القيود، فإن الفكرة الأساسية والطرق التقنية تتمتع بقيمة أكاديمية وعملية مهمة، وتستحق مزيدًا من البحث المتعمق والتطبيق والترويج.