2025-11-15T07:25:11.598246

Causality Enhancement for Cross-Domain Recommendation

Wu, Wu, Jiang et al.

Cross-domain recommendation forms a crucial component in recommendation systems. It leverages auxiliary information through source domain tasks or features to enhance target domain recommendations. However, incorporating inconsistent source domain tasks may result in insufficient cross-domain modeling or negative transfer. While incorporating source domain features without considering the underlying causal relationships may limit their contribution to final predictions. Thus, a natural idea is to directly train a cross-domain representation on a causality-labeled dataset from the source to target domain. Yet this direction has been rarely explored, as identifying unbiased real causal labels is highly challenging in real-world scenarios. In this work, we attempt to take a first step in this direction by proposing a causality-enhanced framework, named CE-CDR. Specifically, we first reformulate the cross-domain recommendation as a causal graph for principled guidance. We then construct a causality-aware dataset heuristically. Subsequently, we derive a theoretically unbiased Partial Label Causal Loss to generalize beyond the biased causality-aware dataset to unseen cross-domain patterns, yielding an enriched cross-domain representation, which is then fed into the target model to enhance target-domain recommendations. Theoretical and empirical analyses, as well as extensive experiments, demonstrate the rationality and effectiveness of CE-CDR and its general applicability as a model-agnostic plugin. Moreover, it has been deployed in production since April 2025, showing its practical value in real-world applications.

academic

Causality Enhancement for Cross-Domain Recommendation

基本信息

论文ID: 2510.14641
标题: Causality Enhancement for Cross-Domain Recommendation
作者: Zhibo Wu, Yunfan Wu, Lin Jiang, Ping Yang, Yao Hu (Xiaohongshu Co., Ltd)
分类: cs.IR cs.AI
发表会议: Conference acronym 'XX (根据PDF内容，似乎是会议模板)
论文链接: https://arxiv.org/abs/2510.14641

摘要

跨域推荐是推荐系统的重要组成部分，通过源域任务或特征的辅助信息来增强目标域推荐。然而，引入不一致的源域任务可能导致跨域建模不足或负迁移，而不考虑潜在因果关系地引入源域特征可能限制其对最终预测的贡献。本文提出了一个因果增强框架CE-CDR，首先将跨域推荐重新表述为因果图，然后启发式地构建因果感知数据集，并推导出理论上无偏的部分标签因果损失函数，以泛化到未见的跨域模式。该方法已在生产环境中部署，显示了其实际应用价值。

研究背景与动机

核心问题

传统的跨域推荐系统面临两个主要挑战：

任务不一致性：多任务学习方法通过共享参数或表示来促进跨域知识迁移，但由于域间任务的不一致性，可能无法捕获有价值的跨域信息，甚至引起负迁移
因果关系稀疏性：将源域行为作为附加输入特征的方法忽略了源域和目标域之间的因果关系稀疏性，用户在目标域的偏好不一定受源域行为影响

研究动机

现有方法要么学习函数L→S和L→T（多任务学习），要么学习函数(L,S)→T（特征融合），但都没有直接建模跨域因果关系。本文提出直接在因果标注数据集上训练跨域表示，学习函数(L,S)→I→T，其中I表示有价值的跨域可迁移信息。

挑战与创新

主要挑战是在现实场景中识别无偏的真实因果标签极其困难。本文通过启发式构建因果感知数据集并设计理论上无偏的损失函数来解决这一问题。

核心贡献

因果图重构：首次将跨域推荐任务重新表述为因果图，为方法设计提供原则性指导
因果增强框架：提出CE-CDR框架，从数据和模型两个角度直接建模跨域因果关系
理论创新：推导出理论上无偏的部分标签因果损失（PLCL），能够泛化到未见的因果模式
实用性验证：作为模型无关的插件具有通用适用性，已在生产环境中部署并取得显著效果

方法详解

任务定义

考虑包含源域s和目标域t的跨域推荐场景，两域共享用户集U。每个域有自己的物品集：源域Is和目标域It。用户u在两域都有交互序列Ss^u和St^u。目标是利用源域知识改善目标域推荐准确性。

模型架构

CE-CDR框架包含三个核心模块：

1. 因果标注模块（CLM）

核心假设：相似性-因果性对齐假设

对于给定用户，其在源域物品is上的偏好会因果影响其对目标域相似物品it的偏好

实现方法：

使用内容相似性和行为相似性两种度量
内容嵌入通过跨域共享类别分类任务学习
行为嵌入通过全局用户-物品交互图的图编码器生成
相似性计算公式：

sim^{c,b}(is, it) = (S^{c,b}_{is})^T S^{c,b}_{it}

整体相似性通过CDF校准后取最大值：

sim(is, it) = max(Fc(sim^c(is, it)), Fb(sim^b(is, it)))

2. 直接因果建模模块（DCMM）

骨干模型：基于SASRec的注意力机制

f(u, S^u_s, it) = σ([fse(ffe(u), fem(i^u,1_s), fem(i^u,2_s), ...)]^T fem(it))

部分标签因果损失（PLCL）：核心创新在于处理部分标注问题。由于高相似性不是因果关系的必要条件，直接在CLM构建的数据集上训练会产生偏差。

命题1：给定真实倾向得分e(x)，因果模型f(x)通过以下损失优化可学习到理论上无偏的因果概率估计：

L = (1/n)∑[h(x)δ^1_f(x) + (1-h(x))δ^0_f(x)]

其中校正标签：

h(x) = sg[z + (1-z)f(x)(1-e(x))/(1-f(x)e(x))]

命题2：倾向模型e(x)通过以下损失优化：

L = (1/n)∑h(x)[zδ^1_e(x) + (1-z)δ^0_e(x)]

3. 因果增强模块（CEM）

跨域自注意力：将源域和目标域表示作为长度为2的序列处理

[r^u_s, r^u_t] = P^u = softmax((X^u W^q)(X^u W^k)^T/√d)(X^u W^v)

跨域门控注意力：基于用户特征自适应融合

g^u = σ(LeakyReLU(Q^u W^g,1 + b^g,1)W^g,2 + b^g,2)
ĥ^u = g^u ⊙ r^u_s + (1-g^u)r^u_t

技术创新点

因果视角：首次从因果推理角度重新审视跨域推荐问题
部分标签学习：创新性地将部分标签学习引入因果建模，解决标注偏差问题
理论保证：提供理论上无偏的损失函数，确保模型泛化能力
自适应融合：动态门控机制根据用户特征调节跨域信息贡献

实验设置

数据集

Douban：包含Book和Music两个域，共1,736个共享用户
Amazon：Movies and TV与CDs and Vinyl域，18,547个共享用户
Industry：来自小红书的大规模数据集，Note和Video域，167,766,638个共享用户

评价指标

HR@K：前K推荐中是否包含相关物品
NDCG@K：考虑排名位置的累积增益
K值设置：Douban和Amazon为15，Industry为150

对比方法

Base Model：基础双塔模型
多任务学习方法：CoNet, MAN, DiCUR
特征融合方法：MiNet, TrineCDR
增强版本：各基线方法+CE插件

实现细节

嵌入维度：Douban和Amazon为32，Industry为64
相似性阈值τ：Douban和Amazon为0.9，Industry为0.85
优化器：Adam with default settings

实验结果

主要结果

CE-CDR在所有数据集和评价指标上均优于基线方法：

Douban数据集表现：

Book域：HR@15提升至0.5023（vs最佳基线0.4586），NDCG@15提升至0.3711（vs 0.3436）
Music域：HR@15达到0.4983，NDCG@15达到0.3600

Industry数据集表现：

Note域：HR@150为0.2733，NDCG@150为0.0933
Video域：HR@150为0.3645，NDCG@150为0.0992

消融实验

各组件贡献分析：

CLM模块：移除后性能显著下降，验证高质量因果正样本的重要性
因果损失：直接使用D+作为真实因果集合导致性能下降
自注意力：移除跨域自注意力影响信息交换效果
门控机制：简单拼接替代门控注意力降低个性化融合效果
缓存策略：几乎无性能损失但消除延迟增加

深度分析

泛化能力验证：通过排除一种相似性构建数据集，发现DCMM能识别未见因果模式，证明模型超越标注策略的泛化能力。

特征贡献分析：特征掩码实验显示CE-CDR的跨域特征激活差异远大于基线方法，证明更有效的跨域信息利用。

动态门控解释：源域信息丰富的用户具有更高的门控值，验证自适应融合机制的有效性。

在线实验

生产环境A/B测试（小红书平台）：

Video场景：点击+0.33%，CTR+0.37%，多样性+0.12%
Note场景：点击+0.28%，CTR+0.43%，多样性+0.16%
已于2025年4月部署上线

结论与讨论

主要结论

有效性：CE-CDR在多个数据集上显著优于现有方法
通用性：作为模型无关插件可提升各种基线方法性能
实用性：已在大规模生产环境成功部署
理论性：提供理论保证的因果建模框架

局限性

假设依赖：相似性-因果性对齐假设可能不适用于所有场景
标注质量：启发式因果标注可能引入噪声
计算开销：需要额外的因果模型训练和推理

未来方向

假设优化：探索更精确的因果关系识别方法
多域扩展：扩展到多个源域的因果建模
动态因果：考虑时间动态的因果关系演化

深度评价

优点

创新性强：首次将因果推理系统性地引入跨域推荐
理论扎实：提供严格的数学推导和理论保证
实验充分：多数据集验证、消融实验、在线A/B测试全面
实用价值高：已在生产环境部署并取得显著效果
通用适用：模型无关的插件设计增强了适用性

不足

假设局限：相似性-因果性对齐假设可能过于简化真实因果关系
标注偏差：启发式因果标注方法仍可能引入系统性偏差
复杂度增加：引入额外模块增加了系统复杂度
领域特定：某些设计可能针对内容平台特化，泛化性有待验证

影响力

学术贡献：为跨域推荐领域提供了新的因果建模范式
实践价值：生产环境的成功部署证明了商业价值
研究启发：可能启发更多因果推理在推荐系统中的应用

适用场景

多域平台：如内容分享平台、电商平台等具有多个业务域的场景
冷启动问题：新用户或新物品推荐场景
跨平台推荐：需要跨平台用户行为迁移的场景

参考文献

论文引用了76篇相关文献，涵盖跨域推荐、因果推理、注意力机制等多个领域的重要工作，为方法设计提供了坚实的理论基础。

总体评价：这是一篇在跨域推荐领域具有重要创新意义的论文，将因果推理系统性地引入该领域，提出了理论上有保证且实践中有效的解决方案。论文的理论贡献、实验验证和实际部署都体现了较高的学术和实用价值。

Causality Enhancement for Cross-Domain Recommendation

Causality Enhancement for Cross-Domain Recommendation

基本信息

摘要

研究背景与动机

核心问题

研究动机

挑战与创新

核心贡献

方法详解

任务定义

模型架构

1. 因果标注模块（CLM）

2. 直接因果建模模块（DCMM）

3. 因果增强模块（CEM）

技术创新点

实验设置

数据集

评价指标

对比方法

实现细节

实验结果

主要结果

消融实验

深度分析

在线实验

相关工作

跨域推荐

因果推荐

结论与讨论

主要结论

局限性

未来方向

深度评价

优点

不足

影响力

适用场景

参考文献