2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.

Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.

academic

تعزيز السببية للتوصيات عبر المجالات

المعلومات الأساسية

معرّف الورقة: 2510.14641
العنوان: تعزيز السببية للتوصيات عبر المجالات
المؤلفون: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
التصنيف: cs.IR cs.AI
المؤتمر: قالب المؤتمر 'XX (يبدو أنه قالب مؤتمر بناءً على محتوى PDF)
رابط الورقة: https://arxiv.org/abs/2510.14641

الملخص

التوصيات عبر المجالات تمثل جزءاً مهماً من أنظمة التوصيات، حيث تعزز التوصيات في المجال الهدف من خلال المعلومات المساعدة من مهام أو ميزات المجال المصدر. ومع ذلك، قد يؤدي إدخال مهام المجال المصدر غير المتسقة إلى نمذجة ناقصة عبر المجالات أو نقل سلبي، بينما قد يؤدي إدخال ميزات المجال المصدر دون الأخذ بعين الاعتبار العلاقات السببية الكامنة إلى تحديد مساهمتها في التنبؤ النهائي. تقترح هذه الورقة إطار عمل محسّن بالسببية CE-CDR، الذي يعيد صياغة التوصيات عبر المجالات أولاً كرسم بياني سببي، ثم ينشئ مجموعة بيانات واعية بالسببية بطريقة استكشافية، ويشتق دالة خسارة سببية بعلامات جزئية خالية من الانحياز نظرياً، للتعميم على أنماط عبر المجالات غير المرئية. تم نشر الطريقة في بيئة الإنتاج، مما يوضح قيمتها التطبيقية العملية.

الخلفية البحثية والدافع

المشكلة الأساسية

تواجه أنظمة التوصيات التقليدية عبر المجالات تحديين رئيسيين:

عدم اتساق المهام: تعزز طرق التعلم متعدد المهام نقل المعرفة عبر المجالات من خلال مشاركة المعاملات أو التمثيلات، لكنها قد تفشل في التقاط معلومات قيمة عبر المجالات بسبب عدم اتساق المهام بين المجالات، بل وقد تسبب نقلاً سلبياً
ندرة العلاقات السببية: تتجاهل الطرق التي تستخدم السلوك في المجال المصدر كميزة إدخال إضافية ندرة العلاقات السببية بين المجال المصدر والمجال الهدف، حيث قد لا تتأثر تفضيلات المستخدم في المجال الهدف بالسلوك في المجال المصدر

الدافع البحثي

الطرق الموجودة إما تتعلم الدوال L→S و L→T (التعلم متعدد المهام)، أو تتعلم الدالة (L,S)→T (دمج الميزات)، لكن لا أحد منها ينمذج العلاقات السببية عبر المجالات مباشرة. تقترح هذه الورقة التدريب المباشر على مجموعة بيانات مسماة بالسببية لتمثيلات عبر المجالات، وتعلم الدالة (L,S)→I→T، حيث يمثل I المعلومات القابلة للنقل القيمة عبر المجالات.

التحديات والابتكار

التحدي الرئيسي هو تحديد علامات سببية حقيقية خالية من الانحياز في السيناريوهات الواقعية أمر صعب للغاية. تحل هذه الورقة هذه المشكلة من خلال بناء مجموعة بيانات واعية بالسببية بطريقة استكشافية وتصميم دالة خسارة خالية من الانحياز نظرياً.

المساهمات الأساسية

إعادة بناء الرسم البياني السببي: إعادة صياغة مهمة التوصيات عبر المجالات كرسم بياني سببي للمرة الأولى، مما يوفر إرشادات منهجية لتصميم الطريقة
إطار عمل محسّن بالسببية: اقتراح إطار عمل CE-CDR يقوم بنمذجة العلاقات السببية عبر المجالات مباشرة من جوانب البيانات والنموذج
الابتكار النظري: اشتقاق خسارة سببية بعلامات جزئية خالية من الانحياز نظرياً (PLCL)، قادرة على التعميم على أنماط سببية غير مرئية
التحقق من الجدوى العملية: كمكون إضافي مستقل عن النموذج يتمتع بقابلية تطبيق عامة، وقد تم نشره في بيئة الإنتاج وحقق نتائج ملحوظة

شرح الطريقة

تعريف المهمة

ننظر في سيناريو التوصيات عبر المجالات الذي يحتوي على مجال مصدر s ومجال هدف t، حيث يشترك المجالان في مجموعة المستخدمين U. لكل مجال مجموعة عناصره الخاصة: Is للمجال المصدر و It للمجال الهدف. يمتلك المستخدم u تسلسل تفاعل في كلا المجالين Ss^u و St^u. الهدف هو الاستفادة من معرفة المجال المصدر لتحسين دقة التوصيات في المجال الهدف.

معمارية النموذج

يتضمن إطار عمل CE-CDR ثلاث وحدات أساسية:

1. وحدة التسمية السببية (CLM)

الافتراض الأساسي: افتراض محاذاة التشابه والسببية

بالنسبة لمستخدم معين، فإن تفضيله للعنصر is في المجال المصدر يؤثر سببياً على تفضيله للعنصر المشابه it في المجال الهدف

طريقة التنفيذ:

استخدام مقياسي التشابه: التشابه في المحتوى والتشابه السلوكي
يتم تعلم التضمينات المحتوى من خلال مهمة تصنيف الفئات المشتركة عبر المجالات
يتم إنشاء التضمينات السلوكية من خلال محرر الرسم البياني للتفاعل العام بين المستخدم والعنصر
صيغة حساب التشابه:

sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}

يتم حساب التشابه الإجمالي من خلال معايرة دالة التوزيع التراكمي ثم أخذ القيمة الأقصى:

sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. وحدة النمذجة السببية المباشرة (DCMM)

نموذج العمود الفقري: آلية الانتباه القائمة على SASRec

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

خسارة السببية بالعلامات الجزئية (PLCL): يكمن الابتكار الأساسي في التعامل مع مشكلة التسمية الجزئية. نظراً لأن التشابه العالي ليس شرطاً ضرورياً للعلاقة السببية، فإن التدريب المباشر على مجموعة البيانات التي بنتها CLM سيؤدي إلى انحياز.

الاقتراح 1: بالنظر إلى درجة الميل الحقيقية e(x)، يمكن تعلم نموذج سببي f(x) من خلال تحسين الخسارة التالية للحصول على تقدير احتمالي سببي خالي من الانحياز نظرياً:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

حيث العلامة المصححة:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

الاقتراح 2: يتم تحسين نموذج الميل e(x) من خلال الخسارة التالية:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. وحدة التعزيز السببي (CEM)

الانتباه الذاتي عبر المجالات: معالجة التمثيلات في المجال المصدر والمجال الهدف كتسلسل بطول 2

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

انتباه البوابة عبر المجالات: دمج تكيفي بناءً على ميزات المستخدم

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

نقاط الابتكار التقني

المنظور السببي: أول مرة يتم فيها إعادة فحص مشكلة التوصيات عبر المجالات من منظور الاستدلال السببي
التعلم بالعلامات الجزئية: إدخال مبتكر للتعلم بالعلامات الجزئية في النمذجة السببية، لحل مشكلة انحياز التسمية
الضمان النظري: توفير دالة خسارة خالية من الانحياز نظرياً، مما يضمن قدرة النموذج على التعميم
الدمج التكيفي: آلية بوابة ديناميكية تعدل مساهمة المعلومات عبر المجالات بناءً على ميزات المستخدم

إعداد التجارب

مجموعات البيانات

Douban: تحتوي على مجالي Book و Music، مع 1,736 مستخدماً مشتركاً
Amazon: مجالا Movies and TV و CDs and Vinyl، مع 18,547 مستخدماً مشتركاً
Industry: مجموعة بيانات واسعة النطاق من Xiaohongshu، مجالا Note و Video، مع 167,766,638 مستخدماً مشتركاً

مقاييس التقييم

HR@K: ما إذا كان العنصر ذو الصلة موجوداً في أفضل K توصيات
NDCG@K: الكسب التراكمي المخفف مع الأخذ في الاعتبار موضع الترتيب
قيم K: 15 لـ Douban و Amazon، و 150 لـ Industry

طرق المقارنة

نموذج الأساس: نموذج البرج المزدوج الأساسي
طرق التعلم متعدد المهام: CoNet, MAN, DiCUR
طرق دمج الميزات: MiNet, TrineCDR
الإصدارات المحسّنة: كل طريقة أساسية + مكون CE

تفاصيل التنفيذ

بُعد التضمين: 32 لـ Douban و Amazon، و 64 لـ Industry
عتبة التشابه τ: 0.9 لـ Douban و Amazon، و 0.85 لـ Industry
المحسّن: Adam مع الإعدادات الافتراضية

نتائج التجارب

النتائج الرئيسية

يتفوق CE-CDR على جميع طرق المقارنة في جميع مجموعات البيانات ومقاييس التقييم:

أداء مجموعة بيانات Douban:

مجال Book: HR@15 يصل إلى 0.5023 (مقابل أفضل أساس 0.4586)، NDCG@15 يصل إلى 0.3711 (مقابل 0.3436)
مجال Music: HR@15 يصل إلى 0.4983، NDCG@15 يصل إلى 0.3600

أداء مجموعة بيانات Industry:

مجال Note: HR@150 يساوي 0.2733، NDCG@150 يساوي 0.0933
مجال Video: HR@150 يساوي 0.3645، NDCG@150 يساوي 0.0992

تجارب الاستئصال

تحليل مساهمة كل مكون:

وحدة CLM: إزالتها تؤدي إلى انخفاض كبير في الأداء، مما يتحقق من أهمية العينات الموجبة السببية عالية الجودة
الخسارة السببية: استخدام D+ مباشرة كمجموعة سببية حقيقية يؤدي إلى انخفاض الأداء
الانتباه الذاتي: إزالة الانتباه الذاتي عبر المجالات يؤثر على فعالية تبادل المعلومات
آلية البوابة: استبدال الدمج البسيط بآلية البوابة يقلل من فعالية الدمج الشخصي
استراتيجية التخزين المؤقت: تقريباً لا تؤثر على الأداء لكنها تلغي زيادة التأخير

التحليل العميق

التحقق من قدرة التعميم: من خلال استبعاد نوع واحد من التشابه عند بناء مجموعة البيانات، يتم اكتشاف أن DCMM يمكنه تحديد أنماط سببية غير مرئية، مما يثبت قدرة النموذج على التعميم بما يتجاوز استراتيجية التسمية.

تحليل مساهمة الميزات: تظهر تجارب إخفاء الميزات أن تفعيل الميزات عبر المجالات في CE-CDR يختلف بشكل كبير عن طرق المقارنة، مما يثبت استخدام معلومات عبر المجالات أكثر فعالية.

تفسير البوابة الديناميكية: المستخدمون الذين لديهم معلومات غنية في المجال المصدر لديهم قيم بوابة أعلى، مما يتحقق من فعالية آلية الدمج التكيفي.

التجارب عبر الإنترنت

اختبار A/B في بيئة الإنتاج (منصة Xiaohongshu):

سيناريو Video: النقرات +0.33%، CTR +0.37%، التنوع +0.12%
سيناريو Note: النقرات +0.28%، CTR +0.43%، التنوع +0.16%
تم النشر في الإنتاج في أبريل 2025

الأعمال ذات الصلة

التوصيات عبر المجالات

تنقسم الطرق الموجودة إلى فئتين رئيسيتين:

التعلم متعدد المهام: تعزيز نقل المعرفة من خلال مشاركة المعاملات أو التمثيلات، لكن توجد مشاكل عدم اتساق المهام
دمج الميزات: استخدام السلوك في المجال المصدر كميزة إدخال، لكن تتجاهل ندرة العلاقات السببية

التوصيات السببية

تحل بشكل أساسي ثلاث فئات من المشاكل:

انحياز البيانات: انحياز التعريض، انحياز الشهرة، انحياز المتابعة
البيانات المفقودة: عدم القدرة على التقاط تفضيلات المستخدم الشاملة
القابلية للتفسير: تحسين قابلية التفسير والتنوع والعدالة في التوصيات

هذه الورقة هي الأولى التي تطبق الاستدلال السببي على نمذجة العلاقات السببية المباشرة في التوصيات عبر المجالات.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

الفعالية: يتفوق CE-CDR بشكل كبير على الطرق الموجودة على عدة مجموعات بيانات
العمومية: كمكون إضافي مستقل عن النموذج يمكنه تحسين أداء طرق الأساس المختلفة
الجدوى العملية: تم نشره بنجاح في بيئة الإنتاج واسعة النطاق
الصرامة النظرية: يوفر إطار عمل نمذجة سببية مع ضمانات نظرية

القيود

اعتماد الافتراضات: قد لا ينطبق افتراض محاذاة التشابه والسببية على جميع السيناريوهات
جودة التسمية: قد تؤدي طريقة التسمية السببية الاستكشافية إلى إدخال ضوضاء
الحمل الحسابي: يتطلب تدريب واستدلال نموذج سببي إضافي

الاتجاهات المستقبلية

تحسين الافتراضات: استكشاف طرق أكثر دقة لتحديد العلاقات السببية
التوسع متعدد المجالات: توسيع النمذجة السببية إلى عدة مجالات مصدر
السببية الديناميكية: الأخذ في الاعتبار تطور العلاقات السببية الديناميكية بمرور الوقت

التقييم المتعمق

المميزات

ابتكار قوي: أول تطبيق منهجي للاستدلال السببي في التوصيات عبر المجالات
أساس نظري متين: توفير اشتقاق رياضي صارم وضمانات نظرية
تجارب شاملة: التحقق على عدة مجموعات بيانات، تجارب استئصال، اختبارات A/B عبر الإنترنت
قيمة عملية عالية: تم نشره في بيئة الإنتاج وحقق نتائج ملحوظة
قابلية تطبيق عامة: تصميم مكون إضافي مستقل عن النموذج يعزز القابلية للتطبيق

أوجه القصور

حدود الافتراضات: قد يكون افتراض محاذاة التشابه والسببية مبسطاً جداً للعلاقات السببية الحقيقية
انحياز التسمية: قد تؤدي طريقة التسمية السببية الاستكشافية إلى إدخال انحياز منهجي
زيادة التعقيد: إدخال وحدات إضافية يزيد من تعقيد النظام
التخصص بالمجال: قد تكون بعض التصاميم متخصصة لمنصات المحتوى، وتحتاج التعميمية إلى التحقق

التأثير

المساهمة الأكاديمية: توفير نموذج نمذجة سببية جديد لمجال التوصيات عبر المجالات
القيمة العملية: يثبت النشر الناجح في بيئة الإنتاج القيمة التجارية
الإلهام البحثي: قد يلهم المزيد من تطبيقات الاستدلال السببي في أنظمة التوصيات

السيناريوهات القابلة للتطبيق

منصات متعددة المجالات: مثل منصات مشاركة المحتوى والمنصات الإلكترونية التي تحتوي على عدة مجالات عمل
مشاكل البداية الباردة: سيناريوهات توصية المستخدمين الجدد أو العناصر الجديدة
التوصيات عبر المنصات: السيناريوهات التي تتطلب نقل سلوك المستخدم عبر المنصات

المراجع

تستشهد الورقة بـ 76 مرجعاً ذا صلة، تغطي التوصيات عبر المجالات والاستدلال السببي وآليات الانتباه وغيرها من المجالات المهمة، مما يوفر أساساً نظرياً متيناً لتصميم الطريقة.

التقييم الإجمالي: هذه ورقة بحثية ذات أهمية ابتكارية مهمة في مجال التوصيات عبر المجالات، حيث تطبق الاستدلال السببي بشكل منهجي على هذا المجال، وتقترح حلاً مضموناً نظرياً وفعالاً عملياً. تعكس المساهمات النظرية والتحقق التجريبي والنشر العملي للورقة قيمة أكاديمية وعملية عالية.