Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
ক্রস-ডোমেইন সুপারিশ সুপারিশ সিস্টেমের একটি গুরুত্বপূর্ণ উপাদান, যা উৎস ডোমেইন কাজ বা বৈশিষ্ট্যের সহায়ক তথ্য দ্বারা লক্ষ্য ডোমেইন সুপারিশ উন্নত করে। তবে অসামঞ্জস্যপূর্ণ উৎস ডোমেইন কাজ প্রবর্তন করা ক্রস-ডোমেইন মডেলিং অপর্যাপ্ততা বা নেতিবাচক স্থানান্তর হতে পারে, এবং সম্ভাব্য কার্যকারণ সম্পর্ক বিবেচনা না করে উৎস ডোমেইন বৈশিষ্ট্য প্রবর্তন চূড়ান্ত পূর্বাভাসে এর অবদান সীমাবদ্ধ করতে পারে। এই পেপারটি একটি কার্যকারণতা বর্ধন কাঠামো CE-CDR প্রস্তাব করে, যা প্রথমে ক্রস-ডোমেইন সুপারিশকে একটি কার্যকারণ গ্রাফ হিসাবে পুনর্নির্ধারণ করে, তারপর কার্যকারণতা-সচেতন ডেটাসেট অনুমানমূলকভাবে নির্মাণ করে এবং তাত্ত্বিকভাবে নিরপেক্ষ আংশিক লেবেল কার্যকারণ ক্ষতি ফাংশন বের করে, যা অদেখা ক্রস-ডোমেইন প্যাটার্নে সাধারণীকরণ করতে পারে। এই পদ্ধতিটি উৎপাদন পরিবেশে স্থাপন করা হয়েছে, এর ব্যবহারিক প্রয়োগ মূল্য প্রদর্শন করে।
ঐতিহ্যবাহী ক্রস-ডোমেইন সুপারিশ সিস্টেম দুটি প্রধান চ্যালেঞ্জের সম্মুখীন:
কাজের অসামঞ্জস্যতা: বহু-কাজ শেখার পদ্ধতি পরামিতি বা প্রতিনিধিত্ব ভাগ করে ক্রস-ডোমেইন জ্ঞান স্থানান্তর প্রচার করে, কিন্তু ডোমেইন জুড়ে কাজের অসামঞ্জস্যতার কারণে মূল্যবান ক্রস-ডোমেইন তথ্য ক্যাপচার করতে ব্যর্থ হতে পারে, এমনকি নেতিবাচক স্থানান্তর সৃষ্টি করতে পারে
কার্যকারণ সম্পর্ক বিরলতা: উৎস ডোমেইন আচরণকে অতিরিক্ত ইনপুট বৈশিষ্ট্য হিসাবে গ্রহণ করার পদ্ধতি উৎস এবং লক্ষ্য ডোমেইনের মধ্যে কার্যকারণ সম্পর্ক বিরলতা উপেক্ষা করে, ব্যবহারকারীর লক্ষ্য ডোমেইনে পছন্দ অগত্যা উৎস ডোমেইন আচরণ দ্বারা প্রভাবিত হয় না
বিদ্যমান পদ্ধতি হয় L→S এবং L→T ফাংশন শিখে (বহু-কাজ শেখা) বা (L,S)→T ফাংশন শিখে (বৈশিষ্ট্য সংমিশ্রণ), কিন্তু কোনটিই সরাসরি ক্রস-ডোমেইন কার্যকারণ সম্পর্ক মডেল করে না। এই পেপারটি সরাসরি কার্যকারণতা-সংযুক্ত ডেটাসেটে ক্রস-ডোমেইন প্রতিনিধিত্ব প্রশিক্ষণ প্রস্তাব করে, (L,S)→I→T ফাংশন শিখে, যেখানে I মূল্যবান ক্রস-ডোমেইন স্থানান্তরযোগ্য তথ্য প্রতিনিধিত্ব করে।
প্রধান চ্যালেঞ্জ হল বাস্তব পরিস্থিতিতে নিরপেক্ষ প্রকৃত কার্যকারণ লেবেল চিহ্নিত করা অত্যন্ত কঠিন। এই পেপারটি অনুমানমূলক কার্যকারণতা-সচেতন ডেটাসেট নির্মাণ এবং তাত্ত্বিকভাবে নিরপেক্ষ ক্ষতি ফাংশন ডিজাইন করে এই সমস্যা সমাধান করে।
কার্যকারণ গ্রাফ পুনর্নির্মাণ: প্রথমবারের মতো ক্রস-ডোমেইন সুপারিশ কাজকে একটি কার্যকারণ গ্রাফ হিসাবে পুনর্নির্ধারণ করা, পদ্ধতি ডিজাইনের জন্য নীতিগত নির্দেশনা প্রদান করে
কার্যকারণতা বর্ধন কাঠামো: CE-CDR কাঠামো প্রস্তাব করা, ডেটা এবং মডেল উভয় দিক থেকে সরাসরি ক্রস-ডোমেইন কার্যকারণ সম্পর্ক মডেল করে
তাত্ত্বিক উদ্ভাবন: তাত্ত্বিকভাবে নিরপেক্ষ আংশিক লেবেল কার্যকারণ ক্ষতি (PLCL) বের করা, যা অদেখা কার্যকারণ প্যাটার্নে সাধারণীকরণ করতে পারে
ব্যবহারিক যাচাইকরণ: মডেল-অজ্ঞেয়বাদী প্লাগইন হিসাবে সর্বজনীন প্রযোজ্যতা সহ, উৎপাদন পরিবেশে স্থাপন করা হয়েছে এবং উল্লেখযোগ্য প্রভাব অর্জন করেছে
উৎস ডোমেইন s এবং লক্ষ্য ডোমেইন t সহ ক্রস-ডোমেইন সুপারিশ পরিস্থিতি বিবেচনা করুন, উভয় ডোমেইন ব্যবহারকারী সেট U ভাগ করে। প্রতিটি ডোমেইনের নিজস্ব আইটেম সেট রয়েছে: উৎস ডোমেইন Is এবং লক্ষ্য ডোমেইন It। ব্যবহারকারী u উভয় ডোমেইনে ইন্টারঅ্যাকশন সিকোয়েন্স Ss^u এবং St^u রয়েছে। লক্ষ্য হল লক্ষ্য ডোমেইন সুপারিশ নির্ভুলতা উন্নত করতে উৎস ডোমেইন জ্ঞান ব্যবহার করা।
আংশিক লেবেল কার্যকারণ ক্ষতি (PLCL):
মূল উদ্ভাবন আংশিক সংযুক্তি সমস্যা পরিচালনায় নিহিত। উচ্চ সাদৃশ্য কার্যকারণ সম্পর্কের প্রয়োজনীয় শর্ত নয় বলে, CLM দ্বারা নির্মিত ডেটাসেটে সরাসরি প্রশিক্ষণ পক্ষপাত তৈরি করে।
প্রস্তাব 1: প্রকৃত প্রবণতা স্কোর e(x) দেওয়া, কার্যকারণ মডেল f(x) নিম্নলিখিত ক্ষতির মাধ্যমে অপ্টিমাইজ করে তাত্ত্বিকভাবে নিরপেক্ষ কার্যকারণ সম্ভাবনা অনুমান শিখতে পারে:
L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]
যেখানে সংশোধিত লেবেল:
h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]
প্রস্তাব 2: প্রবণতা মডেল e(x) নিম্নলিখিত ক্ষতির মাধ্যমে অপ্টিমাইজ করা:
সাধারণীকরণ ক্ষমতা যাচাইকরণ:
একটি সাদৃশ্য নির্মাণ পদ্ধতি বাদ দিয়ে ডেটাসেট তৈরি করে, DCMM অদেখা কার্যকারণ প্যাটার্ন চিহ্নিত করতে পারে, মডেল লেবেলিং কৌশল অতিক্রম করে সাধারণীকরণ ক্ষমতা প্রমাণ করে।
বৈশিষ্ট্য অবদান বিশ্লেষণ:
বৈশিষ্ট্য মাস্কিং পরীক্ষা দেখায় CE-CDR-এর ক্রস-ডোমেইন বৈশিষ্ট্য সক্রিয়করণ পার্থক্য বেসলাইন পদ্ধতির চেয়ে অনেক বেশি, আরও কার্যকর ক্রস-ডোমেইন তথ্য ব্যবহার প্রমাণ করে।
গতিশীল গেটিং ব্যাখ্যা:
উৎস ডোমেইন তথ্য সমৃদ্ধ ব্যবহারকারীরা উচ্চতর গেটিং মূল্য রাখে, অভিযোজিত সংমিশ্রণ প্রক্রিয়ার কার্যকারিতা যাচাই করে।
পেপারটি 76টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, ক্রস-ডোমেইন সুপারিশ, কার্যকারণ অনুমান, মনোযোগ প্রক্রিয়া এবং অন্যান্য একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, পদ্ধতি ডিজাইনের জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি ক্রস-ডোমেইন সুপারিশ ক্ষেত্রে গুরুত্বপূর্ণ উদ্ভাবন তাৎপর্য সহ একটি পেপার, যা কার্যকারণ অনুমান সিস্টেমেটিকভাবে এই ক্ষেত্রে প্রবর্তন করে, তাত্ত্বিকভাবে গ্যারান্টিযুক্ত এবং ব্যবহারিকভাবে কার্যকর সমাধান প্রস্তাব করে। পেপারের তাত্ত্বিক অবদান, পরীক্ষা যাচাইকরণ এবং ব্যবহারিক স্থাপনা সব উচ্চ একাডেমিক এবং ব্যবহারিক মূল্য প্রতিফলিত করে।