Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
التوصيات عبر المجالات تمثل جزءاً مهماً من أنظمة التوصيات، حيث تعزز التوصيات في المجال الهدف من خلال المعلومات المساعدة من مهام أو ميزات المجال المصدر. ومع ذلك، قد يؤدي إدخال مهام المجال المصدر غير المتسقة إلى نمذجة ناقصة عبر المجالات أو نقل سلبي، بينما قد يؤدي إدخال ميزات المجال المصدر دون الأخذ بعين الاعتبار العلاقات السببية الكامنة إلى تحديد مساهمتها في التنبؤ النهائي. تقترح هذه الورقة إطار عمل محسّن بالسببية CE-CDR، الذي يعيد صياغة التوصيات عبر المجالات أولاً كرسم بياني سببي، ثم ينشئ مجموعة بيانات واعية بالسببية بطريقة استكشافية، ويشتق دالة خسارة سببية بعلامات جزئية خالية من الانحياز نظرياً، للتعميم على أنماط عبر المجالات غير المرئية. تم نشر الطريقة في بيئة الإنتاج، مما يوضح قيمتها التطبيقية العملية.
تواجه أنظمة التوصيات التقليدية عبر المجالات تحديين رئيسيين:
عدم اتساق المهام: تعزز طرق التعلم متعدد المهام نقل المعرفة عبر المجالات من خلال مشاركة المعاملات أو التمثيلات، لكنها قد تفشل في التقاط معلومات قيمة عبر المجالات بسبب عدم اتساق المهام بين المجالات، بل وقد تسبب نقلاً سلبياً
ندرة العلاقات السببية: تتجاهل الطرق التي تستخدم السلوك في المجال المصدر كميزة إدخال إضافية ندرة العلاقات السببية بين المجال المصدر والمجال الهدف، حيث قد لا تتأثر تفضيلات المستخدم في المجال الهدف بالسلوك في المجال المصدر
الطرق الموجودة إما تتعلم الدوال L→S و L→T (التعلم متعدد المهام)، أو تتعلم الدالة (L,S)→T (دمج الميزات)، لكن لا أحد منها ينمذج العلاقات السببية عبر المجالات مباشرة. تقترح هذه الورقة التدريب المباشر على مجموعة بيانات مسماة بالسببية لتمثيلات عبر المجالات، وتعلم الدالة (L,S)→I→T، حيث يمثل I المعلومات القابلة للنقل القيمة عبر المجالات.
التحدي الرئيسي هو تحديد علامات سببية حقيقية خالية من الانحياز في السيناريوهات الواقعية أمر صعب للغاية. تحل هذه الورقة هذه المشكلة من خلال بناء مجموعة بيانات واعية بالسببية بطريقة استكشافية وتصميم دالة خسارة خالية من الانحياز نظرياً.
ننظر في سيناريو التوصيات عبر المجالات الذي يحتوي على مجال مصدر s ومجال هدف t، حيث يشترك المجالان في مجموعة المستخدمين U. لكل مجال مجموعة عناصره الخاصة: Is للمجال المصدر و It للمجال الهدف. يمتلك المستخدم u تسلسل تفاعل في كلا المجالين Ss^u و St^u. الهدف هو الاستفادة من معرفة المجال المصدر لتحسين دقة التوصيات في المجال الهدف.
خسارة السببية بالعلامات الجزئية (PLCL):
يكمن الابتكار الأساسي في التعامل مع مشكلة التسمية الجزئية. نظراً لأن التشابه العالي ليس شرطاً ضرورياً للعلاقة السببية، فإن التدريب المباشر على مجموعة البيانات التي بنتها CLM سيؤدي إلى انحياز.
الاقتراح 1: بالنظر إلى درجة الميل الحقيقية e(x)، يمكن تعلم نموذج سببي f(x) من خلال تحسين الخسارة التالية للحصول على تقدير احتمالي سببي خالي من الانحياز نظرياً:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
حيث العلامة المصححة:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
الاقتراح 2: يتم تحسين نموذج الميل e(x) من خلال الخسارة التالية:
التحقق من قدرة التعميم:
من خلال استبعاد نوع واحد من التشابه عند بناء مجموعة البيانات، يتم اكتشاف أن DCMM يمكنه تحديد أنماط سببية غير مرئية، مما يثبت قدرة النموذج على التعميم بما يتجاوز استراتيجية التسمية.
تحليل مساهمة الميزات:
تظهر تجارب إخفاء الميزات أن تفعيل الميزات عبر المجالات في CE-CDR يختلف بشكل كبير عن طرق المقارنة، مما يثبت استخدام معلومات عبر المجالات أكثر فعالية.
تفسير البوابة الديناميكية:
المستخدمون الذين لديهم معلومات غنية في المجال المصدر لديهم قيم بوابة أعلى، مما يتحقق من فعالية آلية الدمج التكيفي.
تستشهد الورقة بـ 76 مرجعاً ذا صلة، تغطي التوصيات عبر المجالات والاستدلال السببي وآليات الانتباه وغيرها من المجالات المهمة، مما يوفر أساساً نظرياً متيناً لتصميم الطريقة.
التقييم الإجمالي: هذه ورقة بحثية ذات أهمية ابتكارية مهمة في مجال التوصيات عبر المجالات، حيث تطبق الاستدلال السببي بشكل منهجي على هذا المجال، وتقترح حلاً مضموناً نظرياً وفعالاً عملياً. تعكس المساهمات النظرية والتحقق التجريبي والنشر العملي للورقة قيمة أكاديمية وعملية عالية.