2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
academic

क्रॉस-डोमेन सिफारिश के लिए कार्यकारणता वृद्धि

बुनियादी जानकारी

  • पेपर ID: 2510.14641
  • शीर्षक: Causality Enhancement for Cross-Domain Recommendation
  • लेखक: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
  • वर्गीकरण: cs.IR cs.AI
  • प्रकाशन सम्मेलन: Conference acronym 'XX (PDF सामग्री के अनुसार, सम्मेलन टेम्पलेट प्रतीत होता है)
  • पेपर लिंक: https://arxiv.org/abs/2510.14641

सारांश

क्रॉस-डोमेन सिफारिश सिफारिश प्रणाली का एक महत्वपूर्ण घटक है, जो स्रोत डोमेन कार्यों या विशेषताओं की सहायक जानकारी के माध्यम से लक्ष्य डोमेन सिफारिश को बढ़ाता है। हालांकि, असंगत स्रोत डोमेन कार्यों को शामिल करने से क्रॉस-डोमेन मॉडलिंग अपर्याप्त हो सकती है या नकारात्मक स्थानांतरण हो सकता है, और संभावित कार्यकारणता संबंधों पर विचार किए बिना स्रोत डोमेन विशेषताओं को शामिल करने से अंतिम भविष्यवाणी में इसका योगदान सीमित हो सकता है। यह पेपर एक कार्यकारणता वृद्धि ढांचा CE-CDR प्रस्तावित करता है, जो पहले क्रॉस-डोमेन सिफारिश को कार्यकारणता ग्राफ के रूप में पुनः तैयार करता है, फिर सहज रूप से कार्यकारणता-जागरूक डेटासेट का निर्माण करता है, और सैद्धांतिक रूप से निष्पक्ष आंशिक लेबल कार्यकारणता हानि फ़ंक्शन प्राप्त करता है, जो अदेखे क्रॉस-डोमेन पैटर्न के लिए सामान्यीकृत हो सकता है। यह विधि उत्पादन वातावरण में तैनात की गई है, जो इसके व्यावहारिक अनुप्रयोग मूल्य को दर्शाती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

मुख्य समस्या

पारंपरिक क्रॉस-डोमेन सिफारिश प्रणाली दो मुख्य चुनौतियों का सामना करती है:

  1. कार्य असंगतता: बहु-कार्य शिक्षण विधियां साझा मापदंडों या प्रतिनिधित्व के माध्यम से क्रॉस-डोमेन ज्ञान स्थानांतरण को बढ़ावा देती हैं, लेकिन डोमेन के बीच कार्यों की असंगतता के कारण, मूल्यवान क्रॉस-डोमेन जानकारी को कैप्चर नहीं कर सकते हैं, और यहां तक कि नकारात्मक स्थानांतरण भी कर सकते हैं
  2. कार्यकारणता विरलता: स्रोत डोमेन व्यवहार को अतिरिक्त इनपुट विशेषता के रूप में लेने की विधियां स्रोत डोमेन और लक्ष्य डोमेन के बीच कार्यकारणता विरलता को नजरअंदाज करती हैं, उपयोगकर्ता की लक्ष्य डोमेन में प्राथमिकता आवश्यक रूप से स्रोत डोमेन व्यवहार से प्रभावित नहीं होती है

अनुसंधान प्रेरणा

मौजूदा विधियां या तो फ़ंक्शन L→S और L→T (बहु-कार्य शिक्षण) सीखती हैं, या फ़ंक्शन (L,S)→T (विशेषता संलयन) सीखती हैं, लेकिन कोई भी क्रॉस-डोमेन कार्यकारणता संबंधों को सीधे मॉडल नहीं करता है। यह पेपर क्रॉस-डोमेन प्रतिनिधित्व को कार्यकारणता-एनोटेटेड डेटासेट पर सीधे प्रशिक्षित करने का प्रस्ताव करता है, फ़ंक्शन (L,S)→I→T सीखता है, जहां I मूल्यवान क्रॉस-डोमेन स्थानांतरणीय जानकारी का प्रतिनिधित्व करता है।

चुनौतियां और नवाचार

मुख्य चुनौती वास्तविक परिदृश्यों में निष्पक्ष वास्तविक कार्यकारणता लेबल की पहचान करना अत्यंत कठिन है। यह पेपर कार्यकारणता-जागरूक डेटासेट को सहज रूप से निर्माण करके और सैद्धांतिक रूप से निष्पक्ष हानि फ़ंक्शन डिजाइन करके इस समस्या को हल करता है।

मुख्य योगदान

  1. कार्यकारणता ग्राफ पुनर्निर्माण: पहली बार क्रॉस-डोमेन सिफारिश कार्य को कार्यकारणता ग्राफ के रूप में पुनः तैयार करना, विधि डिजाइन के लिए सिद्धांत-आधारित मार्गदर्शन प्रदान करना
  2. कार्यकारणता वृद्धि ढांचा: CE-CDR ढांचा प्रस्तावित करना, डेटा और मॉडल दोनों कोणों से क्रॉस-डोमेन कार्यकारणता संबंधों को सीधे मॉडल करना
  3. सैद्धांतिक नवाचार: सैद्धांतिक रूप से निष्पक्ष आंशिक लेबल कार्यकारणता हानि (PLCL) प्राप्त करना, जो अदेखे कार्यकारणता पैटर्न के लिए सामान्यीकृत हो सकता है
  4. व्यावहारिकता सत्यापन: मॉडल-अज्ञेयवादी प्लगइन के रूप में सामान्य प्रयोज्यता रखना, उत्पादन वातावरण में तैनात किया गया है और उल्लेखनीय प्रभाव प्राप्त किया है

विधि विवरण

कार्य परिभाषा

स्रोत डोमेन s और लक्ष्य डोमेन t वाले क्रॉस-डोमेन सिफारिश परिदृश्य पर विचार करें, दोनों डोमेन उपयोगकर्ता सेट U साझा करते हैं। प्रत्येक डोमेन के पास अपना आइटम सेट है: स्रोत डोमेन Is और लक्ष्य डोमेन It। उपयोगकर्ता u के पास दोनों डोमेन में इंटरैक्शन अनुक्रम Ss^u और St^u हैं। लक्ष्य स्रोत डोमेन ज्ञान का उपयोग करके लक्ष्य डोमेन सिफारिश सटीकता में सुधार करना है।

मॉडल आर्किटेक्चर

CE-CDR ढांचे में तीन मुख्य मॉड्यूल हैं:

1. कार्यकारणता एनोटेशन मॉड्यूल (CLM)

मुख्य धारणा: समानता-कार्यकारणता संरेखण धारणा

दिए गए उपयोगकर्ता के लिए, उनकी स्रोत डोमेन आइटम is पर प्राथमिकता लक्ष्य डोमेन में समान आइटम it पर उनकी प्राथमिकता को कार्यकारणता से प्रभावित करेगी

कार्यान्वयन विधि:

  • सामग्री समानता और व्यवहार समानता दोनों उपायों का उपयोग
  • सामग्री एम्बेडिंग क्रॉस-डोमेन साझा श्रेणी वर्गीकरण कार्य के माध्यम से सीखी जाती है
  • व्यवहार एम्बेडिंग वैश्विक उपयोगकर्ता-आइटम इंटरैक्शन ग्राफ के ग्राफ एनकोडर द्वारा उत्पन्न होती है
  • समानता गणना सूत्र:
sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}
  • समग्र समानता CDF कैलिब्रेशन के बाद अधिकतम मान लेती है:
sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. प्रत्यक्ष कार्यकारणता मॉडलिंग मॉड्यूल (DCMM)

बैकबोन मॉडल: SASRec पर आधारित ध्यान तंत्र

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

आंशिक लेबल कार्यकारणता हानि (PLCL): मुख्य नवाचार आंशिक एनोटेशन समस्या को संभालना है। चूंकि उच्च समानता कार्यकारणता का आवश्यक शर्त नहीं है, CLM द्वारा निर्मित डेटासेट पर सीधे प्रशिक्षण पूर्वाग्रह उत्पन्न करेगा।

प्रस्ताव 1: वास्तविक प्रवृत्ति स्कोर e(x) दिया गया, कार्यकारणता मॉडल f(x) निम्नलिखित हानि के माध्यम से अनुकूलित किया जा सकता है, सैद्धांतिक रूप से निष्पक्ष कार्यकारणता संभावना अनुमान सीख सकता है:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

जहां सुधारा गया लेबल:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

प्रस्ताव 2: प्रवृत्ति मॉडल e(x) निम्नलिखित हानि के माध्यम से अनुकूलित किया जाता है:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. कार्यकारणता वृद्धि मॉड्यूल (CEM)

क्रॉस-डोमेन स्व-ध्यान: स्रोत डोमेन और लक्ष्य डोमेन प्रतिनिधित्व को लंबाई 2 के अनुक्रम के रूप में संभालना

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

क्रॉस-डोमेन गेटेड ध्यान: उपयोगकर्ता विशेषताओं के आधार पर अनुकूली संलयन

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

तकनीकी नवाचार बिंदु

  1. कार्यकारणता दृष्टिकोण: पहली बार क्रॉस-डोमेन सिफारिश समस्या को कार्यकारणता अनुमान कोण से व्यवस्थित रूप से पुनः परीक्षा करना
  2. आंशिक लेबल शिक्षा: नवीन रूप से आंशिक लेबल शिक्षा को कार्यकारणता मॉडलिंग में शामिल करना, एनोटेशन पूर्वाग्रह समस्या को हल करना
  3. सैद्धांतिक गारंटी: सैद्धांतिक रूप से निष्पक्ष हानि फ़ंक्शन प्रदान करना, मॉडल सामान्यीकरण क्षमता सुनिश्चित करना
  4. अनुकूली संलयन: गतिशील गेटिंग तंत्र उपयोगकर्ता विशेषताओं के अनुसार क्रॉस-डोमेन जानकारी योगदान को समायोजित करना

प्रयोगात्मक सेटअप

डेटासेट

  1. Douban: Book और Music दो डोमेन शामिल, कुल 1,736 साझा उपयोगकर्ता
  2. Amazon: Movies and TV और CDs and Vinyl डोमेन, 18,547 साझा उपयोगकर्ता
  3. Industry: Xiaohongshu प्लेटफॉर्म से बड़े पैमाने पर डेटासेट, Note और Video डोमेन, 167,766,638 साझा उपयोगकर्ता

मूल्यांकन मेट्रिक्स

  • HR@K: शीर्ष K सिफारिशों में क्या प्रासंगिक आइटम शामिल है
  • NDCG@K: रैंकिंग स्थिति पर विचार करते हुए संचयी लाभ
  • K मान सेटिंग: Douban और Amazon के लिए 15, Industry के लिए 150

तुलना विधियां

  • Base Model: बुनियादी दोहरी-टावर मॉडल
  • बहु-कार्य शिक्षण विधियां: CoNet, MAN, DiCUR
  • विशेषता संलयन विधियां: MiNet, TrineCDR
  • वर्धित संस्करण: प्रत्येक आधारभूत विधि + CE प्लगइन

कार्यान्वयन विवरण

  • एम्बेडिंग आयाम: Douban और Amazon के लिए 32, Industry के लिए 64
  • समानता थ्रेसहोल्ड τ: Douban और Amazon के लिए 0.9, Industry के लिए 0.85
  • अनुकूलक: डिफ़ॉल्ट सेटिंग्स के साथ Adam

प्रयोगात्मक परिणाम

मुख्य परिणाम

CE-CDR सभी डेटासेट और मूल्यांकन मेट्रिक्स पर आधारभूत विधियों से बेहतर प्रदर्शन करता है:

Douban डेटासेट प्रदर्शन:

  • Book डोमेन: HR@15 0.5023 तक बढ़ता है (बनाम सर्वश्रेष्ठ आधारभूत 0.4586), NDCG@15 0.3711 तक बढ़ता है (बनाम 0.3436)
  • Music डोमेन: HR@15 0.4983 तक पहुंचता है, NDCG@15 0.3600 तक पहुंचता है

Industry डेटासेट प्रदर्शन:

  • Note डोमेन: HR@150 0.2733, NDCG@150 0.0933
  • Video डोमेन: HR@150 0.3645, NDCG@150 0.0992

विलोपन प्रयोग

प्रत्येक घटक योगदान विश्लेषण:

  • CLM मॉड्यूल: हटाने के बाद प्रदर्शन में उल्लेखनीय गिरावट, उच्च-गुणवत्ता कार्यकारणता सकारात्मक नमूनों की महत्ता को सत्यापित करना
  • कार्यकारणता हानि: D+ को वास्तविक कार्यकारणता सेट के रूप में सीधे उपयोग करने से प्रदर्शन में गिरावट आती है
  • स्व-ध्यान: क्रॉस-डोमेन स्व-ध्यान हटाने से जानकारी विनिमय प्रभाव को प्रभावित करता है
  • गेटिंग तंत्र: गेटेड ध्यान को सरल संयोजन से बदलने से व्यक्तिगत संलयन प्रभाव कम होता है
  • कैशिंग रणनीति: लगभग कोई प्रदर्शन हानि नहीं लेकिन विलंब को समाप्त करता है

गहन विश्लेषण

सामान्यीकरण क्षमता सत्यापन: एक समानता निर्माण विधि को बाहर करके डेटासेट निर्माण करके, DCMM अदेखे कार्यकारणता पैटर्न की पहचान कर सकता है, यह साबित करता है कि मॉडल एनोटेशन रणनीति से परे सामान्यीकरण क्षमता रखता है।

विशेषता योगदान विश्लेषण: विशेषता मास्किंग प्रयोग दिखाता है कि CE-CDR का क्रॉस-डोमेन विशेषता सक्रियण अंतर आधारभूत विधियों से बहुत अधिक है, अधिक प्रभावी क्रॉस-डोमेन जानकारी उपयोग को साबित करता है।

गतिशील गेटिंग व्याख्या: स्रोत डोमेन जानकारी समृद्ध उपयोगकर्ताओं के पास उच्च गेटिंग मान होते हैं, अनुकूली संलयन तंत्र की प्रभावशीलता को सत्यापित करता है।

ऑनलाइन प्रयोग

उत्पादन वातावरण A/B परीक्षण (Xiaohongshu प्लेटफॉर्म):

  • Video परिदृश्य: क्लिक +0.33%, CTR +0.37%, विविधता +0.12%
  • Note परिदृश्य: क्लिक +0.28%, CTR +0.43%, विविधता +0.16%
  • अप्रैल 2025 में ऑनलाइन तैनात किया गया

संबंधित कार्य

क्रॉस-डोमेन सिफारिश

मौजूदा विधियां मुख्य रूप से दो श्रेणियों में विभाजित हैं:

  1. बहु-कार्य शिक्षा: साझा मापदंडों या प्रतिनिधित्व के माध्यम से ज्ञान स्थानांतरण को बढ़ावा देना, लेकिन कार्य असंगतता समस्या मौजूद है
  2. विशेषता संलयन: स्रोत डोमेन व्यवहार को इनपुट विशेषता के रूप में लेना, लेकिन कार्यकारणता संबंध विरलता को नजरअंदाज करना

कार्यकारणता सिफारिश

मुख्य रूप से तीन श्रेणियों की समस्याओं को हल करना:

  1. डेटा पूर्वाग्रह: एक्सपोजर पूर्वाग्रह, लोकप्रियता पूर्वाग्रह, भीड़ पूर्वाग्रह
  2. अनुपलब्ध डेटा: उपयोगकर्ता व्यापक प्राथमिकता को कैप्चर नहीं कर सकते
  3. व्याख्यात्मकता: सिफारिश व्याख्यात्मकता, विविधता और निष्पक्षता में सुधार

यह पेपर पहली बार क्रॉस-डोमेन सिफारिश के प्रत्यक्ष कार्यकारणता संबंध मॉडलिंग के लिए कार्यकारणता अनुमान लागू करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. प्रभावशीलता: CE-CDR कई डेटासेट पर मौजूदा विधियों से महत्वपूर्ण रूप से बेहतर है
  2. सामान्यता: मॉडल-अज्ञेयवादी प्लगइन के रूप में विभिन्न आधारभूत विधियों के प्रदर्शन में सुधार कर सकता है
  3. व्यावहारिकता: बड़े पैमाने पर उत्पादन वातावरण में सफलतापूर्वक तैनात किया गया है
  4. सैद्धांतिकता: सैद्धांतिक गारंटी के साथ कार्यकारणता मॉडलिंग ढांचा प्रदान करता है

सीमाएं

  1. धारणा निर्भरता: समानता-कार्यकारणता संरेखण धारणा सभी परिदृश्यों के लिए उपयुक्त नहीं हो सकती है
  2. एनोटेशन गुणवत्ता: सहज कार्यकारणता एनोटेशन शोर परिचय कर सकता है
  3. कम्प्यूटेशनल ओवरहेड: अतिरिक्त कार्यकारणता मॉडल प्रशिक्षण और अनुमान की आवश्यकता है

भविष्य की दिशाएं

  1. धारणा अनुकूलन: अधिक सटीक कार्यकारणता संबंध पहचान विधियों की खोज
  2. बहु-डोमेन विस्तार: कई स्रोत डोमेन के कार्यकारणता मॉडलिंग तक विस्तार
  3. गतिशील कार्यकारणता: समय गतिशील कार्यकारणता संबंध विकास पर विचार

गहन मूल्यांकन

शक्तियां

  1. मजबूत नवाचार: पहली बार क्रॉस-डोमेन सिफारिश में कार्यकारणता अनुमान को व्यवस्थित रूप से शामिल करना
  2. ठोस सिद्धांत: कठोर गणितीय व्युत्पत्ति और सैद्धांतिक गारंटी प्रदान करना
  3. व्यापक प्रयोग: बहु-डेटासेट सत्यापन, विलोपन प्रयोग, ऑनलाइन A/B परीक्षण व्यापक
  4. उच्च व्यावहारिक मूल्य: उत्पादन वातावरण में तैनात किया गया है और उल्लेखनीय प्रभाव प्राप्त किया है
  5. सामान्य प्रयोज्यता: मॉडल-अज्ञेयवादी प्लगइन डिजाइन प्रयोज्यता को बढ़ाता है

कमियां

  1. धारणा सीमा: समानता-कार्यकारणता संरेखण धारणा वास्तविक कार्यकारणता संबंधों को अत्यधिक सरल बना सकती है
  2. एनोटेशन पूर्वाग्रह: सहज कार्यकारणता एनोटेशन विधि अभी भी व्यवस्थित पूर्वाग्रह परिचय कर सकती है
  3. जटिलता वृद्धि: अतिरिक्त मॉड्यूल शामिल करने से सिस्टम जटिलता बढ़ती है
  4. डोमेन-विशिष्ट: कुछ डिजाइन सामग्री प्लेटफॉर्म के लिए विशेषीकृत हो सकते हैं, सामान्यीकरण क्षमता सत्यापन की आवश्यकता है

प्रभाव

  1. शैक्षणिक योगदान: क्रॉस-डोमेन सिफारिश क्षेत्र के लिए नया कार्यकारणता मॉडलिंग प्रतिमान प्रदान करना
  2. व्यावहारिक मूल्य: उत्पादन वातावरण में सफल तैनाती व्यावसायिक मूल्य को साबित करती है
  3. अनुसंधान प्रेरणा: सिफारिश प्रणाली में कार्यकारणता अनुमान के अधिक अनुप्रयोगों को प्रेरित कर सकता है

लागू परिदृश्य

  1. बहु-डोमेन प्लेटफॉर्म: सामग्री साझाकरण प्लेटफॉर्म, ई-कॉमर्स प्लेटफॉर्म जैसे कई व्यावसायिक डोमेन वाले परिदृश्य
  2. कोल्ड स्टार्ट समस्या: नए उपयोगकर्ता या नई आइटम सिफारिश परिदृश्य
  3. क्रॉस-प्लेटफॉर्म सिफारिश: क्रॉस-प्लेटफॉर्म उपयोगकर्ता व्यवहार स्थानांतरण की आवश्यकता वाले परिदृश्य

संदर्भ

पेपर 76 संबंधित संदर्भों का हवाला देता है, जो क्रॉस-डोमेन सिफारिश, कार्यकारणता अनुमान, ध्यान तंत्र और अन्य कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, विधि डिजाइन के लिए ठोस सैद्धांतिक आधार प्रदान करता है।


समग्र मूल्यांकन: यह क्रॉस-डोमेन सिफारिश क्षेत्र में महत्वपूर्ण नवाचार महत्व वाला एक पेपर है, जो कार्यकारणता अनुमान को इस क्षेत्र में व्यवस्थित रूप से शामिल करता है, सैद्धांतिक रूप से गारंटीकृत और व्यावहारिक रूप से प्रभावी समाधान प्रस्तावित करता है। पेपर के सैद्धांतिक योगदान, प्रयोगात्मक सत्यापन और व्यावहारिक तैनाती सभी उच्च शैक्षणिक और व्यावहारिक मूल्य को प्रदर्शित करते हैं।