Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
क्रॉस-डोमेन सिफारिश सिफारिश प्रणाली का एक महत्वपूर्ण घटक है, जो स्रोत डोमेन कार्यों या विशेषताओं की सहायक जानकारी के माध्यम से लक्ष्य डोमेन सिफारिश को बढ़ाता है। हालांकि, असंगत स्रोत डोमेन कार्यों को शामिल करने से क्रॉस-डोमेन मॉडलिंग अपर्याप्त हो सकती है या नकारात्मक स्थानांतरण हो सकता है, और संभावित कार्यकारणता संबंधों पर विचार किए बिना स्रोत डोमेन विशेषताओं को शामिल करने से अंतिम भविष्यवाणी में इसका योगदान सीमित हो सकता है। यह पेपर एक कार्यकारणता वृद्धि ढांचा CE-CDR प्रस्तावित करता है, जो पहले क्रॉस-डोमेन सिफारिश को कार्यकारणता ग्राफ के रूप में पुनः तैयार करता है, फिर सहज रूप से कार्यकारणता-जागरूक डेटासेट का निर्माण करता है, और सैद्धांतिक रूप से निष्पक्ष आंशिक लेबल कार्यकारणता हानि फ़ंक्शन प्राप्त करता है, जो अदेखे क्रॉस-डोमेन पैटर्न के लिए सामान्यीकृत हो सकता है। यह विधि उत्पादन वातावरण में तैनात की गई है, जो इसके व्यावहारिक अनुप्रयोग मूल्य को दर्शाती है।
पारंपरिक क्रॉस-डोमेन सिफारिश प्रणाली दो मुख्य चुनौतियों का सामना करती है:
कार्य असंगतता: बहु-कार्य शिक्षण विधियां साझा मापदंडों या प्रतिनिधित्व के माध्यम से क्रॉस-डोमेन ज्ञान स्थानांतरण को बढ़ावा देती हैं, लेकिन डोमेन के बीच कार्यों की असंगतता के कारण, मूल्यवान क्रॉस-डोमेन जानकारी को कैप्चर नहीं कर सकते हैं, और यहां तक कि नकारात्मक स्थानांतरण भी कर सकते हैं
कार्यकारणता विरलता: स्रोत डोमेन व्यवहार को अतिरिक्त इनपुट विशेषता के रूप में लेने की विधियां स्रोत डोमेन और लक्ष्य डोमेन के बीच कार्यकारणता विरलता को नजरअंदाज करती हैं, उपयोगकर्ता की लक्ष्य डोमेन में प्राथमिकता आवश्यक रूप से स्रोत डोमेन व्यवहार से प्रभावित नहीं होती है
मौजूदा विधियां या तो फ़ंक्शन L→S और L→T (बहु-कार्य शिक्षण) सीखती हैं, या फ़ंक्शन (L,S)→T (विशेषता संलयन) सीखती हैं, लेकिन कोई भी क्रॉस-डोमेन कार्यकारणता संबंधों को सीधे मॉडल नहीं करता है। यह पेपर क्रॉस-डोमेन प्रतिनिधित्व को कार्यकारणता-एनोटेटेड डेटासेट पर सीधे प्रशिक्षित करने का प्रस्ताव करता है, फ़ंक्शन (L,S)→I→T सीखता है, जहां I मूल्यवान क्रॉस-डोमेन स्थानांतरणीय जानकारी का प्रतिनिधित्व करता है।
मुख्य चुनौती वास्तविक परिदृश्यों में निष्पक्ष वास्तविक कार्यकारणता लेबल की पहचान करना अत्यंत कठिन है। यह पेपर कार्यकारणता-जागरूक डेटासेट को सहज रूप से निर्माण करके और सैद्धांतिक रूप से निष्पक्ष हानि फ़ंक्शन डिजाइन करके इस समस्या को हल करता है।
कार्यकारणता ग्राफ पुनर्निर्माण: पहली बार क्रॉस-डोमेन सिफारिश कार्य को कार्यकारणता ग्राफ के रूप में पुनः तैयार करना, विधि डिजाइन के लिए सिद्धांत-आधारित मार्गदर्शन प्रदान करना
कार्यकारणता वृद्धि ढांचा: CE-CDR ढांचा प्रस्तावित करना, डेटा और मॉडल दोनों कोणों से क्रॉस-डोमेन कार्यकारणता संबंधों को सीधे मॉडल करना
सैद्धांतिक नवाचार: सैद्धांतिक रूप से निष्पक्ष आंशिक लेबल कार्यकारणता हानि (PLCL) प्राप्त करना, जो अदेखे कार्यकारणता पैटर्न के लिए सामान्यीकृत हो सकता है
व्यावहारिकता सत्यापन: मॉडल-अज्ञेयवादी प्लगइन के रूप में सामान्य प्रयोज्यता रखना, उत्पादन वातावरण में तैनात किया गया है और उल्लेखनीय प्रभाव प्राप्त किया है
स्रोत डोमेन s और लक्ष्य डोमेन t वाले क्रॉस-डोमेन सिफारिश परिदृश्य पर विचार करें, दोनों डोमेन उपयोगकर्ता सेट U साझा करते हैं। प्रत्येक डोमेन के पास अपना आइटम सेट है: स्रोत डोमेन Is और लक्ष्य डोमेन It। उपयोगकर्ता u के पास दोनों डोमेन में इंटरैक्शन अनुक्रम Ss^u और St^u हैं। लक्ष्य स्रोत डोमेन ज्ञान का उपयोग करके लक्ष्य डोमेन सिफारिश सटीकता में सुधार करना है।
आंशिक लेबल कार्यकारणता हानि (PLCL):
मुख्य नवाचार आंशिक एनोटेशन समस्या को संभालना है। चूंकि उच्च समानता कार्यकारणता का आवश्यक शर्त नहीं है, CLM द्वारा निर्मित डेटासेट पर सीधे प्रशिक्षण पूर्वाग्रह उत्पन्न करेगा।
प्रस्ताव 1: वास्तविक प्रवृत्ति स्कोर e(x) दिया गया, कार्यकारणता मॉडल f(x) निम्नलिखित हानि के माध्यम से अनुकूलित किया जा सकता है, सैद्धांतिक रूप से निष्पक्ष कार्यकारणता संभावना अनुमान सीख सकता है:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
जहां सुधारा गया लेबल:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
प्रस्ताव 2: प्रवृत्ति मॉडल e(x) निम्नलिखित हानि के माध्यम से अनुकूलित किया जाता है:
सामान्यीकरण क्षमता सत्यापन:
एक समानता निर्माण विधि को बाहर करके डेटासेट निर्माण करके, DCMM अदेखे कार्यकारणता पैटर्न की पहचान कर सकता है, यह साबित करता है कि मॉडल एनोटेशन रणनीति से परे सामान्यीकरण क्षमता रखता है।
विशेषता योगदान विश्लेषण:
विशेषता मास्किंग प्रयोग दिखाता है कि CE-CDR का क्रॉस-डोमेन विशेषता सक्रियण अंतर आधारभूत विधियों से बहुत अधिक है, अधिक प्रभावी क्रॉस-डोमेन जानकारी उपयोग को साबित करता है।
गतिशील गेटिंग व्याख्या:
स्रोत डोमेन जानकारी समृद्ध उपयोगकर्ताओं के पास उच्च गेटिंग मान होते हैं, अनुकूली संलयन तंत्र की प्रभावशीलता को सत्यापित करता है।
पेपर 76 संबंधित संदर्भों का हवाला देता है, जो क्रॉस-डोमेन सिफारिश, कार्यकारणता अनुमान, ध्यान तंत्र और अन्य कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, विधि डिजाइन के लिए ठोस सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह क्रॉस-डोमेन सिफारिश क्षेत्र में महत्वपूर्ण नवाचार महत्व वाला एक पेपर है, जो कार्यकारणता अनुमान को इस क्षेत्र में व्यवस्थित रूप से शामिल करता है, सैद्धांतिक रूप से गारंटीकृत और व्यावहारिक रूप से प्रभावी समाधान प्रस्तावित करता है। पेपर के सैद्धांतिक योगदान, प्रयोगात्मक सत्यापन और व्यावहारिक तैनाती सभी उच्च शैक्षणिक और व्यावहारिक मूल्य को प्रदर्शित करते हैं।