2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.

Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.

academic

교차 도메인 추천을 위한 인과성 강화

기본 정보

논문 ID: 2510.14641
제목: Causality Enhancement for Cross-Domain Recommendation
저자: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
분류: cs.IR cs.AI
발표 학회: Conference acronym 'XX (PDF 내용에 따르면 학회 템플릿)
논문 링크: https://arxiv.org/abs/2510.14641

초록

교차 도메인 추천은 추천 시스템의 중요한 구성 요소로, 원본 도메인 작업 또는 특징의 보조 정보를 통해 목표 도메인 추천을 강화합니다. 그러나 불일치하는 원본 도메인 작업을 도입하면 교차 도메인 모델링 부족 또는 음의 전이가 발생할 수 있으며, 잠재적 인과 관계를 고려하지 않고 원본 도메인 특징을 도입하면 최종 예측에 대한 기여도가 제한될 수 있습니다. 본 논문은 교차 도메인 추천을 인과 그래프로 재구성한 후, 휴리스틱 방식으로 인과 인식 데이터셋을 구축하고, 미관측 교차 도메인 패턴으로 일반화할 수 있는 이론적으로 편향되지 않은 부분 레이블 인과 손실 함수를 도출하는 인과성 강화 프레임워크 CE-CDR을 제안합니다. 본 방법은 프로덕션 환경에 배포되어 실제 응용 가치를 입증했습니다.

연구 배경 및 동기

핵심 문제

기존의 교차 도메인 추천 시스템은 두 가지 주요 과제에 직면해 있습니다:

작업 불일치성: 다중 작업 학습 방법은 매개변수 또는 표현 공유를 통해 교차 도메인 지식 전이를 촉진하지만, 도메인 간 작업의 불일치로 인해 가치 있는 교차 도메인 정보를 포착하지 못하거나 음의 전이를 유발할 수 있습니다.
인과 관계 희소성: 원본 도메인 행동을 추가 입력 특징으로 사용하는 방법은 원본 도메인과 목표 도메인 간의 인과 관계 희소성을 무시합니다. 사용자의 목표 도메인 선호도가 반드시 원본 도메인 행동의 영향을 받는 것은 아닙니다.

연구 동기

기존 방법은 함수 L→S와 L→T를 학습하거나(다중 작업 학습), 함수 (L,S)→T를 학습하지만(특징 융합), 교차 도메인 인과 관계를 직접 모델링하지 않습니다. 본 논문은 인과 주석이 달린 데이터셋에서 직접 교차 도메인 표현을 학습하여 함수 (L,S)→I→T를 학습하는 것을 제안합니다. 여기서 I는 가치 있는 교차 도메인 전이 가능 정보를 나타냅니다.

과제 및 혁신

주요 과제는 실제 시나리오에서 편향되지 않은 진정한 인과 레이블을 식별하는 것이 극히 어렵다는 것입니다. 본 논문은 휴리스틱 방식으로 인과 인식 데이터셋을 구축하고 이론적으로 편향되지 않은 손실 함수를 설계하여 이 문제를 해결합니다.

핵심 기여

인과 그래프 재구성: 교차 도메인 추천 작업을 인과 그래프로 처음 재구성하여 방법 설계에 원칙적 지침을 제공합니다.
인과성 강화 프레임워크: 데이터와 모델 두 측면에서 교차 도메인 인과 관계를 직접 모델링하는 CE-CDR 프레임워크를 제안합니다.
이론적 혁신: 미관측 인과 패턴으로 일반화할 수 있는 이론적으로 편향되지 않은 부분 레이블 인과 손실(PLCL)을 도출합니다.
실용성 검증: 모델 무관 플러그인으로서 광범위한 적용 가능성을 가지며, 프로덕션 환경에 배포되어 현저한 효과를 거두었습니다.

방법 상세 설명

작업 정의

원본 도메인 s와 목표 도메인 t를 포함하는 교차 도메인 추천 시나리오를 고려합니다. 두 도메인은 사용자 집합 U를 공유합니다. 각 도메인은 자체 물품 집합을 가집니다: 원본 도메인 Is와 목표 도메인 It. 사용자 u는 두 도메인에서 모두 상호작용 수열 Ss^u와 St^u를 가집니다. 목표는 원본 도메인 지식을 활용하여 목표 도메인 추천 정확성을 개선하는 것입니다.

모델 아키텍처

CE-CDR 프레임워크는 세 가지 핵심 모듈을 포함합니다:

1. 인과 주석 모듈(CLM)

핵심 가정: 유사성-인과성 정렬 가정

주어진 사용자에 대해, 원본 도메인 물품 is에 대한 선호도는 목표 도메인의 유사한 물품 it에 대한 선호도에 인과적으로 영향을 미칩니다.

구현 방법:

내용 유사성과 행동 유사성 두 가지 측정 방식 사용
내용 임베딩은 교차 도메인 공유 카테고리 분류 작업을 통해 학습
행동 임베딩은 전역 사용자-물품 상호작용 그래프의 그래프 인코더로 생성
유사성 계산 공식:

sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}

전체 유사성은 CDF 보정 후 최댓값으로 계산:

sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. 직접 인과 모델링 모듈(DCMM)

백본 모델: SASRec 기반 주의 메커니즘

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

부분 레이블 인과 손실(PLCL): 핵심 혁신은 부분 주석 문제를 처리하는 것입니다. 높은 유사성이 인과 관계의 필요 조건이 아니므로, CLM이 구축한 데이터셋에서 직접 학습하면 편향이 발생합니다.

명제 1: 진정한 성향 점수 e(x)가 주어질 때, 인과 모델 f(x)는 다음 손실을 통해 최적화하여 이론적으로 편향되지 않은 인과 확률 추정을 학습할 수 있습니다:

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

여기서 보정된 레이블:

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

명제 2: 성향 모델 e(x)는 다음 손실을 통해 최적화됩니다:

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. 인과성 강화 모듈(CEM)

교차 도메인 자기 주의: 원본 도메인과 목표 도메인 표현을 길이 2의 수열로 처리

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

교차 도메인 게이팅 주의: 사용자 특징 기반 적응형 융합

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

기술적 혁신점

인과 관점: 인과 추론 관점에서 처음으로 교차 도메인 추천 문제를 재검토합니다.
부분 레이블 학습: 부분 레이블 학습을 인과 모델링에 혁신적으로 도입하여 주석 편향 문제를 해결합니다.
이론적 보장: 이론적으로 편향되지 않은 손실 함수를 제공하여 모델 일반화 능력을 보장합니다.
적응형 융합: 동적 게이팅 메커니즘이 사용자 특징에 따라 교차 도메인 정보 기여도를 조절합니다.

실험 설정

데이터셋

Douban: Book과 Music 두 도메인 포함, 1,736개의 공유 사용자
Amazon: Movies and TV와 CDs and Vinyl 도메인, 18,547개의 공유 사용자
Industry: 소홍서(Xiaohongshu)의 대규모 데이터셋, Note와 Video 도메인, 167,766,638개의 공유 사용자

평가 지표

HR@K: 상위 K 추천에 관련 물품 포함 여부
NDCG@K: 순위 위치를 고려한 누적 이득
K 값 설정: Douban과 Amazon은 15, Industry는 150

비교 방법

기본 모델: 기본 이중 타워 모델
다중 작업 학습 방법: CoNet, MAN, DiCUR
특징 융합 방법: MiNet, TrineCDR
강화 버전: 각 기선 방법 + CE 플러그인

구현 세부사항

임베딩 차원: Douban과 Amazon은 32, Industry는 64
유사성 임계값 τ: Douban과 Amazon은 0.9, Industry는 0.85
최적화기: 기본 설정의 Adam

실험 결과

주요 결과

CE-CDR은 모든 데이터셋과 평가 지표에서 기선 방법을 능가합니다:

Douban 데이터셋 성능:

Book 도메인: HR@15이 0.5023으로 향상됨(최고 기선 0.4586 대비), NDCG@15이 0.3711로 향상됨(0.3436 대비)
Music 도메인: HR@15은 0.4983, NDCG@15은 0.3600

Industry 데이터셋 성능:

Note 도메인: HR@150은 0.2733, NDCG@150은 0.0933
Video 도메인: HR@150은 0.3645, NDCG@150은 0.0992

제거 실험

각 구성 요소 기여도 분석:

CLM 모듈: 제거 후 성능이 현저히 저하되어 고품질 인과 양성 샘플의 중요성을 검증합니다.
인과 손실: D+를 진정한 인과 집합으로 직접 사용하면 성능이 저하됩니다.
자기 주의: 교차 도메인 자기 주의 제거는 정보 교환 효과에 영향을 미칩니다.
게이팅 메커니즘: 게이팅 주의를 단순 연결로 대체하면 개인화 융합 효과가 감소합니다.
캐싱 전략: 거의 성능 손실 없이 지연을 제거합니다.

심층 분석

일반화 능력 검증: 한 가지 유사성 구성 데이터셋을 제외하여 발견한 결과, DCMM은 미관측 인과 패턴을 식별할 수 있으며, 이는 모델이 주석 전략을 초과하는 일반화 능력을 증명합니다.

특징 기여도 분석: 특징 마스킹 실험은 CE-CDR의 교차 도메인 특징 활성화 차이가 기선 방법보다 훨씬 크다는 것을 보여주며, 더 효과적인 교차 도메인 정보 활용을 증명합니다.

동적 게이팅 해석: 원본 도메인 정보가 풍부한 사용자는 더 높은 게이팅 값을 가지며, 이는 적응형 융합 메커니즘의 효과성을 검증합니다.

온라인 실험

프로덕션 환경 A/B 테스트(소홍서 플랫폼):

Video 시나리오: 클릭 +0.33%, CTR +0.37%, 다양성 +0.12%
Note 시나리오: 클릭 +0.28%, CTR +0.43%, 다양성 +0.16%
2025년 4월에 배포 완료

결론 및 논의

주요 결론

효과성: CE-CDR은 여러 데이터셋에서 기존 방법을 현저히 능가합니다.
통용성: 모델 무관 플러그인으로서 다양한 기선 방법의 성능을 향상시킬 수 있습니다.
실용성: 대규모 프로덕션 환경에 성공적으로 배포되었습니다.
이론성: 이론적 보장을 제공하는 인과 모델링 프레임워크를 제공합니다.

제한사항

가정 의존성: 유사성-인과성 정렬 가정이 모든 시나리오에 적용되지 않을 수 있습니다.
주석 품질: 휴리스틱 인과 주석이 노이즈를 도입할 수 있습니다.
계산 오버헤드: 추가 인과 모델 학습 및 추론이 필요합니다.

향후 방향

가정 최적화: 더 정확한 인과 관계 식별 방법 탐색
다중 도메인 확장: 여러 원본 도메인의 인과 모델링으로 확장
동적 인과: 시간 동적을 고려한 인과 관계 진화

심층 평가

장점

높은 혁신성: 인과 추론을 교차 도메인 추천에 처음으로 체계적으로 도입합니다.
견고한 이론: 엄격한 수학적 유도 및 이론적 보장을 제공합니다.
충분한 실험: 다중 데이터셋 검증, 제거 실험, 온라인 A/B 테스트가 포괄적입니다.
높은 실용 가치: 프로덕션 환경에 배포되어 현저한 효과를 거두었습니다.
광범위한 적용 가능성: 모델 무관 플러그인 설계로 적용 가능성을 향상시킵니다.

부족한 점

가정의 한계: 유사성-인과성 정렬 가정이 실제 인과 관계를 과도하게 단순화할 수 있습니다.
주석 편향: 휴리스틱 인과 주석 방법이 여전히 체계적 편향을 도입할 수 있습니다.
복잡도 증가: 추가 모듈 도입으로 시스템 복잡도가 증가합니다.
도메인 특화: 일부 설계가 콘텐츠 플랫폼에 특화되어 있어 일반화 가능성이 검증 필요합니다.

영향력

학술 기여: 교차 도메인 추천 분야에 새로운 인과 모델링 패러다임을 제공합니다.
실무 가치: 프로덕션 환경의 성공적 배포가 상업적 가치를 증명합니다.
연구 영감: 추천 시스템에서 인과 추론의 더 많은 응용을 영감을 줄 수 있습니다.

적용 시나리오

다중 도메인 플랫폼: 콘텐츠 공유 플랫폼, 전자상거래 플랫폼 등 여러 비즈니스 도메인을 가진 시나리오
콜드 스타트 문제: 신규 사용자 또는 신규 물품 추천 시나리오
교차 플랫폼 추천: 교차 플랫폼 사용자 행동 전이가 필요한 시나리오

참고문헌

논문은 교차 도메인 추천, 인과 추론, 주의 메커니즘 등 여러 분야의 중요한 연구를 포함하는 76편의 관련 문헌을 인용하여 방법 설계에 견고한 이론적 기초를 제공합니다.

종합 평가: 이는 교차 도메인 추천 분야에서 중요한 혁신 의의를 가진 논문으로, 인과 추론을 해당 분야에 체계적으로 도입하여 이론적으로 보장되고 실무적으로 효과적인 해결책을 제시합니다. 논문의 이론적 기여, 실험 검증 및 실제 배포는 모두 높은 학술 및 실용 가치를 보여줍니다.