2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu
Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
academic

شروحات مقارنة عبر التفكير بالحقائق المضادة في الأنظمة الموصية

المعلومات الأساسية

  • معرّف الورقة: 2510.10920
  • العنوان: Comparative Explanations via Counterfactual Reasoning in Recommendations
  • المؤلفون: Yi Yu (شركة هواوي للتكنولوجيا)، Zhenxing Hu (شركة هواوي للتكنولوجيا)
  • التصنيف: cs.IR (استرجاع المعلومات)، cs.AI (الذكاء الاصطناعي)
  • وقت النشر/المؤتمر: مُقدمة إلى مؤتمر في عام 2025 (المؤتمر المحدد قيد الانتظار)
  • رابط الورقة: https://arxiv.org/abs/2510.10920

الملخص

تسعى الأنظمة الموصية القابلة للتفسير من خلال التفكير بالحقائق المضادة إلى تحديد العوامل المؤثرة على المنتجات في التوصيات، والتي يمكن استخدامها كتفسيرات. ومع ذلك، تهدف الطرق المتقدمة الحالية إلى تقليل التغييرات في خصائص المنتج مع عكس قرارات التوصية بناءً على درجات حدود القرار المجمعة، مما يؤدي غالباً إلى عدم دقة واقعية في التفسيرات. لمعالجة هذه المشكلة، تقترح هذه الورقة طريقة جديدة لشروحات الحقائق المضادة المقارنة للتوصيات (CoCountER). يعتمد CoCountER على عمليات التبديل الناعم لإنشاء بيانات الحقائق المضادة، مما يوفر شروحات للتوصيات لأي زوج من المنتجات المقارنة. تتحقق التجارب التجريبية من فعالية الطريقة.

الخلفية البحثية والدافع

تعريف المشكلة

تهدف أنظمة التوصية القابلة للتفسير إلى توفير توصيات عالية الجودة للمستخدمين مع تقديم تفسيرات واضحة تساعد المستخدمين على فهم المنطق الكامن وراء التوصيات، مما يعزز ثقة المستخدمين ورضاهم عن النظام.

قيود الطرق الموجودة

  1. مشاكل الطرق القائمة على المطابقة: تحسّن الطرق القائمة على القوالب (مثل EFM و MTER و A2CF) التمثيلات الموصية والخصائص باستخدام تقنيات تحليل الموترات، لكنها قد تختار خصائص ذات درجات مطابقة عالية لكن أداء فعلية ضعيفة كتفسيرات.
  2. عيوب طرق الحقائق المضادة الموجودة: تحاول طرق مثل CountER عكس القرارات من خلال تقليل تقليل الميزات، لكنها تعاني من مشاكل عدم الدقة الواقعية. على سبيل المثال سماعات الرأس في الورقة، قد يختار CountER الراحة كتفسير لتوصية سماعات الرأس A، لكن في الواقع سماعات الرأس A أقل راحة من سماعات الرأس B.
  3. السبب الجذري: تحسّن الطرق الموجودة مجموع جميع الخصائص المخفضة نحو درجة حد القرار، وليس كل خاصية نحو الحد، مما يؤدي إلى تفسيرات تتناقض مع الحدس.

الدافع البحثي

تقترح هذه الورقة حل المشاكل المذكورة أعلاه من خلال التفكير بالحقائق المضادة المقارنة، من خلال إجراء عمليات تبديل على مستوى الخصائص بين أزواج المنتجات، لتوليد تفسيرات أكثر دقة وتوافقاً مع الحدس.

المساهمات الأساسية

  1. اقتراح طريقة جديدة لإنشاء بيانات الحقائق المضادة: آلية توليد البيانات المضادة بناءً على عمليات التبديل الناعم
  2. إطار عمل شروحات الحقائق المضادة المقارنة المبتكر: يمكن لـ CoCountER توفير شروحات للتوصيات لأي زوج من المنتجات المقارنة
  3. التحقق التجريبي: التحقق من فعالية الطريقة على عدة مجموعات بيانات، متفوقة على الطرق الموجودة في مقاييس الحقائق المضادة

شرح الطريقة

تعريف المهمة

بالنظر إلى المستخدم المستهدف u والمنتج المراد شرحه i والمنتج المرجعي j، حيث تحقق درجات التوصية r_{u,i} > r_{u,j}، الهدف هو تحديد الخصائص الرئيسية المؤثرة على قرار التوصية من خلال أقل عمليات تبديل.

معمارية النموذج

1. معالجة البيانات المسبقة

استخدام أداة Sentires لاستخراج رباعيات (مستخدم، منتج، خاصية، مشاعر) من تعليقات المستخدمين، لبناء:

  • مصفوفة الاهتمام بالمستخدم-الخاصية X: X_{u,a} تمثل درجة اهتمام المستخدم u بالخاصية a
  • مصفوفة جودة المنتج-الخاصية Y: Y_{i,a} تمثل أداء المنتج i على الخاصية a

صيغة الحساب:

X_{u,a} = {
  0، إذا لم يذكر المستخدم u الخاصية a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}})، وإلا
}

Y_{i,a} = {
  0، إذا لم يتم ذكر المنتج i على الخاصية a
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}})، وإلا
}

2. نموذج التوصية

استخدام معمارية طبقة الدمج البسيطة:

r_{u,i} = g_θ(X_u, Y_i)

يتم تنفيذها من خلال شبكة متصلة بالكامل من ثلاث طبقات + دالة تفعيل ReLU + مخرجات Sigmoid.

3. جوهر شروحات الحقائق المضادة المقارنة

تصميم دالة التبديل:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

حيث σ(ψ) هي دالة sigmoid، و ψ هي متجه متغيرات التبديل القابلة للتدريب.

الهدف الأمثل:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

حيث L هي خسارة الترتيب الحدي:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

نقاط الابتكار التقني

  1. عمليات التبديل الناعم: تنفيذ عمليات تبديل قابلة للاشتقاق من خلال دالة sigmoid، حيث تشير القيم القريبة من 0 إلى عدم التبديل والقيم القريبة من 1 إلى التبديل الكامل
  2. الإطار المقارن: على عكس التفسيرات التقليدية للمنتج الواحد، توفير تفسيرات مقارنة بين المنتجات
  3. العمومية: عند تثبيت المنتج المرجعي وحساب الجزء الأول من دالة التبديل فقط، يمكن تقليل الطريقة إلى طريقة الحقائق المضادة القائمة على التقليل

إعداد التجارب

مجموعات البيانات

استخدام ثلاث فئات من مجموعة بيانات تعليقات Amazon:

  • الإلكترونيات: 963 مستخدماً، 1,112 منتجاً، 18,418 تعليقاً، 877 خاصية
  • الأقراص المدمجة والفينيل: 2,129 مستخدماً، 2,907 منتجات، 56,045 تعليقاً، 810 خصائص
  • الأفلام: 5,586 مستخدمين، 6,703 منتجات، 187,490 تعليقاً، 1,530 خاصية

معالجة البيانات: تصفية المستخدمين والمنتجات ذات التفاعلات الأقل من 10 مرات، تقسيم 8:1:1 لمجموعات التدريب والتحقق والاختبار.

مقاييس التقييم

  • مقاييس موجهة للمستخدم: الدقة والاستدعاء
  • مقاييس موجهة للنموذج: احتمالية الضرورة (PN) واحتمالية الكفاية (PS)

طرق المقارنة

  1. الطريقة العشوائية: Random
  2. طرق الترتيب: Sort-i (ترتيب خصائص المنتج)، Sort-u (ترتيب اهتمام المستخدم)
  3. الطرق القائمة على المطابقة: EFM و A2CF
  4. طرق الحقائق المضادة: CountER و CoCountER (طريقة هذه الورقة)

تفاصيل التنفيذ

  • معدل التعلم η محسّن من خلال الانحدار التدريجي
  • عتبة الحد m المستخدمة في خسارة الترتيب
  • عامل التوازن λ لتنسيق الهدفين الأمثليين
  • عتبة التبديل المعينة على 0.5 لتحديد خصائص التفسير

نتائج التجارب

النتائج الرئيسية

على جميع مجموعات البيانات الثلاث، يتفوق CoCountER باستمرار على جميع الطرق الأساسية في مقاييس الحقائق المضادة PN و PS:

مجموعة بيانات الإلكترونيات:

  • PN: 0.734 (مقابل 0.511 لـ CountER)
  • PS: 0.931 (مقابل 0.894 لـ CountER)

مجموعة بيانات الأقراص المدمجة والفينيل:

  • PN: 0.773 (مقابل 0.526 لـ CountER)
  • PS: 0.936 (مقابل 0.921 لـ CountER)

مجموعة بيانات الأفلام:

  • PN: 0.744 (مقابل 0.496 لـ CountER)
  • PS: 0.928 (مقابل 0.889 لـ CountER)

تحليل المعاملات الفائقة

  1. تأثير موضع المنتج المرجعي: المنتجات المرجعية ذات الترتيب الأقل توفر قيوداً تحسينية أقل، مما يسمح باكتشاف المزيد من خصائص الحقائق المضادة الفعالة، مما يحسن أداء PN و PS
  2. تأثير عدد المنتجات المرجعية: زيادة معتدلة في عدد المنتجات المرجعية تحسن الأداء، لكن الإفراط يدخل الضوضاء ويسبب انخفاضاً طفيفاً

النتائج التجريبية

  • يوفر CoCountER تفسيرات أكثر دقة وتوعياً بالسياق من CountER من خلال عمليات تبديل على مستوى الخصائص
  • يمكن لتصميم الحقائق المضادة المقارنة التقاط الخصائص السببية الحقيقية وراء التوصيات
  • تحافظ الطريقة على الاستقرار عبر مجموعة واسعة من الإعدادات، مما يدل على متانة جيدة

الأعمال ذات الصلة

أنظمة التوصية القابلة للتفسير

  1. الطرق القائمة على الخصائص: تستخدم EFM و MTER و A2CF تقنيات تحليل الموترات لبناء تفسيرات على شكل قوالب
  2. طرق التفكير بالحقائق المضادة: قدم CountER التفكير بالحقائق المضادة لأول مرة إلى أنظمة التوصية القابلة للتفسير
  3. طرق توليد النصوص: دمج نماذج اللغة المدربة مسبقاً مثل BERT لتوليد تفسيرات نصية

التفسيرات المقارنة

اقترح Yang وآخرون مفهوم التفسيرات المقارنة، لكنهم استخدموا فك التشفير الانحداري التلقائي لتوليد تفسيرات نصية، وهو يختلف عن منظور التفكير بالحقائق المضادة في هذه الورقة.

تطبيق الاستدلال السببي في الأنظمة الموصية

تم تطبيق الاستدلال السببي على نطاق واسع في السنوات الأخيرة في تعزيز البيانات وتحسين العدالة في أنظمة التوصية.

الخلاصة والنقاش

الاستنتاجات الرئيسية

  1. اقتراح إطار عمل CoCountER الذي يولد تفسيرات توصية أكثر دقة من خلال التفكير بالحقائق المضادة المقارنة
  2. يمكن لعمليات التبديل الناعم تحديد الخصائص الرئيسية المؤثرة على قرارات التوصية بشكل فعال
  3. تثبت التجارب أن الطريقة متفوقة بشكل كبير على الطرق الموجودة في مقاييس الحقائق المضادة

القيود

  1. تبسيط نموذج التوصية: للتركيز على القابلية للتفسير، تم استخدام معمارية نموذج توصية بسيطة نسبياً
  2. التعقيد الحسابي: يتطلب تحسيناً لكل منتج مرجعي، مما يزيد من التكلفة الحسابية
  3. اعتماد الخصائص: تعتمد الطريقة على الخصائص المستخرجة من التعليقات، وحساسة لجودة الخصائص

الاتجاهات المستقبلية

تقترح الورقة دمج التفكير بالحقائق المضادة مع نماذج التوليد لإنتاج تفسيرات باللغة الطبيعية لسيناريوهات الحقائق المضادة.

التقييم المتعمق

المميزات

  1. ابتكار قوي: أول من يقترح إطار عمل شروحات الحقائق المضادة المقارنة، حل مشكلة عدم الدقة الواقعية في الطرق الموجودة
  2. أساس نظري متين: يشرح بوضوح مشاكل الطرق الموجودة من خلال أمثلة محددة ويوفر تحليلاً نظرياً
  3. تصميم الطريقة معقول: يضمن تصميم عمليات التبديل الناعم القابلية للاشتقاق مع توفير تفسيرات بديهية
  4. تجارب شاملة: التحقق على عدة مجموعات بيانات، يتضمن تحليل حساسية المعاملات الفائقة

أوجه القصور

  1. قيود مقاييس التقييم: التركيز الرئيسي على مقاييس الحقائق المضادة، يفتقد إلى الدراسات البشرية للتحقق من الاستخدام الفعلي للتفسيرات
  2. طرق أساسية محدودة: على الرغم من تضمين الطرق الرئيسية للمقارنة، تفتقد إلى المزيد من طرق التفسير بالحقائق المضادة الحديثة
  3. مشاكل قابلية التوسع: مع زيادة عدد المنتجات، ينمو عدد أزواج المنتجات المراعاة بشكل تربيعي
  4. اعتبارات النشر الفعلي غير كافية: نقص النقاش حول الكفاءة وقابلية التوسع عند نشر النظام الموصي الفعلي

التأثير

  1. المساهمة الأكاديمية: توفير اتجاه بحثي جديد لمجال الأنظمة الموصية القابلة للتفسير
  2. القيمة العملية: توليد تفسيرات أكثر توافقاً مع الحدس، مما يساعد على تحسين تجربة المستخدم
  3. قابلية الاستنساخ: توفير وصف خوارزمي مفصل وتفاصيل التنفيذ

السيناريوهات المطبقة

  1. توصيات التجارة الإلكترونية: مناسبة بشكل خاص للسيناريوهات التي تحتاج إلى شرح سبب التوصية بمنتج معين بدلاً من منتج آخر
  2. توصيات المحتوى: يمكن تطبيقها على أنظمة توصية الأفلام والموسيقى وغيرها
  3. القرارات عالية المخاطر: مناسبة للسيناريوهات التي تتطلب قابلية تفسير عالية

المراجع

تستشهد الورقة بـ 30 مرجعاً ذا صلة، تغطي مجالات متعددة مثل الأنظمة الموصية القابلة للتفسير والتفكير بالحقائق المضادة والاستدلال السببي، مما يوفر أساساً نظرياً قوياً للبحث.


التقييم الإجمالي: هذه ورقة بحثية عالية الجودة تقترح إطار عمل شروحات الحقائق المضادة المقارنة المبتكر، وتحل مشكلة مهمة في الطرق الموجودة. تصميم الطريقة معقول، والتحقق التجريبي شامل، وتساهم بشكل كبير في مجال الأنظمة الموصية القابلة للتفسير. على الرغم من وجود بعض القيود، إلا أنها بشكل عام عمل بحثي قيّم.