2025-11-15T18:28:11.606243

S-Diff: An Anisotropic Diffusion Model for Collaborative Filtering in Spectral Domain

Xia, Cheng, Tang et al.

Recovering user preferences from user-item interaction matrices is a key challenge in recommender systems. While diffusion models can sample and reconstruct preferences from latent distributions, they often fail to capture similar users' collective preferences effectively. Additionally, latent variables degrade into pure Gaussian noise during the forward process, lowering the signal-to-noise ratio, which in turn degrades performance. To address this, we propose S-Diff, inspired by graph-based collaborative filtering, better to utilize low-frequency components in the graph spectral domain. S-Diff maps user interaction vectors into the spectral domain and parameterizes diffusion noise to align with graph frequency. This anisotropic diffusion retains significant low-frequency components, preserving a high signal-to-noise ratio. S-Diff further employs a conditional denoising network to encode user interactions, recovering true preferences from noisy data. This method achieves strong results across multiple datasets.

academic

S-Diff: An Anisotropic Diffusion Model for Collaborative Filtering in Spectral Domain

基本信息

论文ID: 2501.00384
标题: S-Diff: An Anisotropic Diffusion Model for Collaborative Filtering in Spectral Domain
作者: Rui Xia, Yanhua Cheng, Yongxiang Tang, Xiaocheng Liu, Xialong Liu, Lisong Wang, Peng Jiang
分类: cs.IR (Information Retrieval)
发表会议: WSDM '25 (The Eighteenth ACM International Conference on Web Search and Data Mining)
论文链接: https://arxiv.org/abs/2501.00384

摘要

推荐系统中从用户-物品交互矩阵恢复用户偏好是一个关键挑战。虽然扩散模型可以从潜在分布中采样和重构偏好，但它们往往无法有效捕获相似用户的集体偏好。此外，在前向过程中潜在变量会退化为纯高斯噪声，降低信噪比，进而影响性能。为解决这些问题，本文提出S-Diff，受图基协同过滤启发，更好地利用图谱域中的低频成分。S-Diff将用户交互向量映射到谱域，并参数化扩散噪声以与图频率对齐。这种各向异性扩散保留了重要的低频成分，维持了高信噪比。S-Diff进一步采用条件去噪网络编码用户交互，从噪声数据中恢复真实偏好。该方法在多个数据集上取得了强劲结果。

研究背景与动机

问题定义

推荐系统的核心任务是从稀疏的用户-物品交互矩阵中恢复用户的真实偏好，这本质上是一个逆问题。传统的协同过滤方法通过挖掘用户间的相似性来解决这一问题。

现有方法的局限性

传统扩散模型的不足：
- 主要依赖个体用户交互向量作为条件输入，未能充分利用协同过滤中用户间的共享偏好信息
- 在高维历史交互向量中注入大量高斯噪声，使得去噪解码器的恢复过程变得复杂
编码-解码不一致性：
- 一些模型在解码网络中显式使用协同信息作为条件指导，但前向过程未反映协同信号
- 导致编码和解码过程之间的不一致性
信噪比退化问题：
- 潜在变量在前向过程中退化为纯高斯噪声，降低信噪比
- 影响模型的整体性能