Causality Enhancement for Cross-Domain Recommendation
Wu, Wu, Jiang et al.
Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.
교차 도메인 추천은 추천 시스템의 중요한 구성 요소로, 원본 도메인 작업 또는 특징의 보조 정보를 통해 목표 도메인 추천을 강화합니다. 그러나 불일치하는 원본 도메인 작업을 도입하면 교차 도메인 모델링 부족 또는 음의 전이가 발생할 수 있으며, 잠재적 인과 관계를 고려하지 않고 원본 도메인 특징을 도입하면 최종 예측에 대한 기여도가 제한될 수 있습니다. 본 논문은 교차 도메인 추천을 인과 그래프로 재구성한 후, 휴리스틱 방식으로 인과 인식 데이터셋을 구축하고, 미관측 교차 도메인 패턴으로 일반화할 수 있는 이론적으로 편향되지 않은 부분 레이블 인과 손실 함수를 도출하는 인과성 강화 프레임워크 CE-CDR을 제안합니다. 본 방법은 프로덕션 환경에 배포되어 실제 응용 가치를 입증했습니다.
기존 방법은 함수 L→S와 L→T를 학습하거나(다중 작업 학습), 함수 (L,S)→T를 학습하지만(특징 융합), 교차 도메인 인과 관계를 직접 모델링하지 않습니다. 본 논문은 인과 주석이 달린 데이터셋에서 직접 교차 도메인 표현을 학습하여 함수 (L,S)→I→T를 학습하는 것을 제안합니다. 여기서 I는 가치 있는 교차 도메인 전이 가능 정보를 나타냅니다.
원본 도메인 s와 목표 도메인 t를 포함하는 교차 도메인 추천 시나리오를 고려합니다. 두 도메인은 사용자 집합 U를 공유합니다. 각 도메인은 자체 물품 집합을 가집니다: 원본 도메인 Is와 목표 도메인 It. 사용자 u는 두 도메인에서 모두 상호작용 수열 Ss^u와 St^u를 가집니다. 목표는 원본 도메인 지식을 활용하여 목표 도메인 추천 정확성을 개선하는 것입니다.
논문은 교차 도메인 추천, 인과 추론, 주의 메커니즘 등 여러 분야의 중요한 연구를 포함하는 76편의 관련 문헌을 인용하여 방법 설계에 견고한 이론적 기초를 제공합니다.
종합 평가: 이는 교차 도메인 추천 분야에서 중요한 혁신 의의를 가진 논문으로, 인과 추론을 해당 분야에 체계적으로 도입하여 이론적으로 보장되고 실무적으로 효과적인 해결책을 제시합니다. 논문의 이론적 기여, 실험 검증 및 실제 배포는 모두 높은 학술 및 실용 가치를 보여줍니다.