2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu
Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
academic

Comparative Explanations via Counterfactual Reasoning in Recommendations

基本信息

  • 论文ID: 2510.10920
  • 标题: Comparative Explanations via Counterfactual Reasoning in Recommendations
  • 作者: Yi Yu (华为技术有限公司), Zhenxing Hu (华为技术有限公司)
  • 分类: cs.IR (信息检索), cs.AI (人工智能)
  • 发表时间/会议: 2025年提交至Conference (具体会议待定)
  • 论文链接: https://arxiv.org/abs/2510.10920

摘要

可解释推荐通过反事实推理寻求识别推荐中物品的影响因子,这些因子可以用作解释。然而,现有的最先进方法旨在最小化产品属性的变化,同时根据聚合决策边界分数逆转推荐决策,这往往导致解释中的事实不准确性。为解决这一问题,本文提出了一种新的推荐比较反事实解释方法(CoCountER)。CoCountER基于软交换操作创建反事实数据,能够为任意比较物品对的推荐提供解释。实证实验验证了该方法的有效性。

研究背景与动机

问题定义

可解释推荐系统旨在为用户提供高质量推荐的同时,给出清晰的解释来帮助用户理解推荐背后的逻辑,从而提高用户对系统的信任度和满意度。

现有方法的局限性

  1. 匹配型方法的问题:基于模板的解释方法(如EFM、MTER、A2CF)通过张量分解技术优化推荐和属性表示,但可能选择匹配分数高但实际表现差的属性作为解释。
  2. 现有反事实方法的缺陷:CountER等方法通过最小化特征减少来逆转决策,但存在事实不准确问题。以论文中的耳机例子为例,CountER可能将舒适度作为推荐耳机A的解释,但实际上耳机A在舒适度方面不如耳机B。
  3. 根本原因:现有方法优化的是将所有减少属性的总和推向决策边界分数,而非将每个属性推向决策边界,导致解释与直觉相矛盾。

研究动机

本文提出通过比较反事实推理来解决上述问题,通过在物品对之间进行属性级别的交换操作,生成更忠实和符合直觉的解释。

核心贡献

  1. 提出了新的反事实数据创建方法:基于软交换操作的反事实数据生成机制
  2. 创新性的比较反事实解释框架:CoCountER能够为任意比较物品对的推荐提供解释
  3. 实验验证:在多个数据集上验证了方法的有效性,在反事实相关指标上超越了现有方法

方法详解

任务定义

给定目标用户u、解释物品i和参考物品j,其中推荐分数满足r_{u,i} > r_{u,j},目标是通过最小的交换操作识别影响推荐决策的关键属性。

模型架构

1. 数据预处理

使用Sentires工具从用户评论中提取(用户,物品,属性,情感)四元组,构建:

  • 用户-属性注意力矩阵X:X_{u,a}表示用户u对属性a的关注度
  • 物品-属性质量矩阵Y:Y_{i,a}表示物品i在属性a上的表现

计算公式:

X_{u,a} = {
  0, 如果用户u未提及属性a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), 否则
}

Y_{i,a} = {
  0, 如果物品i未在属性a上被提及
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), 否则
}

2. 推荐模型

采用简单的融合层架构:

r_{u,i} = g_θ(X_u, Y_i)

通过三层全连接网络+ReLU激活函数+Sigmoid输出实现。

3. 比较反事实解释核心

交换函数设计

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

其中σ(ψ)是sigmoid函数,ψ是可训练的交换变量向量。

优化目标

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

其中L是边界排序损失:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

技术创新点

  1. 软交换操作:通过sigmoid函数实现可微分的交换操作,值接近0表示不交换,接近1表示完全交换
  2. 比较框架:不同于传统的单物品解释,提供物品间的比较解释
  3. 通用性:当固定参考物品且只计算交换函数的第一部分时,可退化为基于减少的反事实方法

实验设置

数据集

使用Amazon评论数据集的三个类别:

  • Electronics:963用户,1,112物品,19,418评论,877属性
  • CDs & Vinyl:2,129用户,2,907物品,56,045评论,810属性
  • Movies:5,586用户,6,703物品,187,490评论,1,530属性

数据预处理:过滤交互少于10次的用户和物品,按8:1:1划分训练/验证/测试集。

评价指标

  • 用户导向指标:Precision和Recall
  • 模型导向指标:Probability of Necessity (PN)和Probability of Sufficiency (PS)

对比方法

  1. 随机方法:Random
  2. 排序方法:Sort-i(按物品属性表现排序),Sort-u(按用户注意力排序)
  3. 匹配型方法:EFM,A2CF
  4. 反事实方法:CountER,CoCountER(本文方法)

实现细节

  • 学习率η通过梯度下降优化
  • 边界阈值m用于排序损失
  • 平衡因子λ协调两个优化目标
  • 交换阈值设为0.5用于识别解释属性

实验结果

主要结果

在所有三个数据集上,CoCountER在反事实相关指标PN和PS上consistently超越所有基线方法:

Electronics数据集

  • PN: 0.734 (vs CountER的0.511)
  • PS: 0.931 (vs CountER的0.894)

CDs & Vinyl数据集

  • PN: 0.773 (vs CountER的0.526)
  • PS: 0.936 (vs CountER的0.921)

Movies数据集

  • PN: 0.744 (vs CountER的0.496)
  • PS: 0.928 (vs CountER的0.889)

超参数分析

  1. 参考物品位置影响:排名越低的参考物品使优化约束更少,能发现更多有效的反事实属性,提升PN和PS性能
  2. 参考物品数量影响:适量增加参考物品数量能提升性能,但过多会引入噪声导致轻微下降

实验发现

  • CoCountER通过属性级交换操作提供了比CountER更忠实和上下文感知的解释
  • 比较反事实设计能够捕获推荐背后真正的因果属性
  • 方法在广泛的设置下保持稳定,展现了良好的鲁棒性

相关工作

可解释推荐系统

  1. 基于属性的方法:EFM、MTER、A2CF等使用张量分解技术构建模板式解释
  2. 反事实推理方法:CountER首次将反事实推理引入可解释推荐
  3. 文本生成方法:结合预训练语言模型如BERT生成文本解释

比较解释

Yang等人提出比较解释概念,但采用自回归解码器生成文本解释,与本文的反事实推理视角不同。

因果推理在推荐中的应用

近年来因果推理被广泛应用于推荐系统的数据增强和公平性改进。

结论与讨论

主要结论

  1. 提出了CoCountER框架,通过比较反事实推理生成更忠实的推荐解释
  2. 软交换操作能够有效识别影响推荐决策的关键属性
  3. 实验证明该方法在反事实指标上显著优于现有方法

局限性

  1. 推荐模型简化:为专注于可解释性,采用了相对简单的推荐模型架构
  2. 计算复杂度:需要为每个参考物品进行优化,增加了计算成本
  3. 属性依赖:方法依赖于从评论中提取的属性,对属性质量敏感

未来方向

论文提出将反事实推理与生成模型结合,产生反事实场景的自然语言解释。

深度评价

优点

  1. 创新性强:首次提出比较反事实解释框架,解决了现有方法的事实不准确问题
  2. 理论基础扎实:通过具体例子清晰说明了现有方法的问题,并提供了理论分析
  3. 方法设计合理:软交换操作的设计既保证了可微分性,又提供了直观的解释
  4. 实验充分:在多个数据集上验证,包含了超参数敏感性分析

不足

  1. 评估指标局限:主要关注反事实指标,缺乏用户研究来验证解释的实际可用性
  2. 基线方法有限:虽然包含了主要的对比方法,但缺少更多近期的反事实解释方法
  3. 可扩展性问题:随着物品数量增加,需要考虑的物品对数量呈平方增长
  4. 实际部署考虑不足:缺乏对实际推荐系统部署时的效率和可扩展性讨论

影响力

  1. 学术贡献:为可解释推荐领域提供了新的研究方向
  2. 实用价值:能够生成更符合直觉的解释,有助于提升用户体验
  3. 可复现性:提供了详细的算法描述和实现细节

适用场景

  1. 电商推荐:特别适用于需要解释为什么推荐某商品而非其他商品的场景
  2. 内容推荐:可应用于电影、音乐等内容推荐系统
  3. 高风险决策:适用于需要高度可解释性的推荐场景

参考文献

论文引用了30篇相关文献,涵盖了可解释推荐、反事实推理、因果推理等多个相关领域的重要工作,为研究提供了solid的理论基础。


总体评价:这是一篇高质量的研究论文,提出了创新的比较反事实解释框架,解决了现有方法的重要问题。方法设计合理,实验验证充分,对可解释推荐领域具有重要贡献。虽然存在一些局限性,但整体上是一项有价值的研究工作。