2025-11-22T06:43:16.272980

Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning

Lee, Lee, Kwak

We introduce the Deep Edge Filter, a novel approach that applies high-pass filtering to deep neural network features to improve model generalizability. Our method is motivated by our hypothesis that neural networks encode task-relevant semantic information in high-frequency components while storing domain-specific biases in low-frequency components of deep features. By subtracting low-pass filtered outputs from original features, our approach isolates generalizable representations while preserving architectural integrity. Experimental results across diverse domains such as Vision, Text, 3D, and Audio demonstrate consistent performance improvements regardless of model architecture and data modality. Analysis reveals that our method induces feature sparsification and effectively isolates high-frequency components, providing empirical validation of our core hypothesis. The code is available at https://github.com/dongkwani/DeepEdgeFilter.

academic

Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning

基本信息

论文ID: 2510.13865
标题: Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning
作者: Dongkwan Lee, Junhoo Lee, Nojun Kwak (Seoul National University)
分类: cs.LG cs.AI
发表时间/会议: 39th Conference on Neural Information Processing Systems (NeurIPS 2025)
论文链接: https://arxiv.org/abs/2510.13865
代码链接: https://github.com/dongkwani/DeepEdgeFilter

摘要

本文提出了Deep Edge Filter，一种将高通滤波应用于深度神经网络特征以提高模型泛化能力的新方法。该方法基于一个假设：神经网络在深度特征的高频分量中编码任务相关的语义信息，而在低频分量中存储领域特定的偏置。通过从原始特征中减去低通滤波输出，该方法能够分离出可泛化的表示，同时保持架构完整性。在视觉、文本、3D和音频等多个领域的实验结果表明，无论模型架构和数据模态如何，该方法都能带来一致的性能提升。分析显示该方法能够诱导特征稀疏化并有效分离高频分量，为核心假设提供了实证验证。

研究背景与动机

问题定义

深度学习模型面临的一个核心挑战是对扰动和领域偏移的脆弱性。现代深度学习模型在训练过程中获得的表面低级纹理依赖进一步加剧了它们对扰动的脆弱性，这在对抗攻击和领域适应等领域表现得尤为明显。

研究动机

作者观察到传统的边缘滤波器在图像处理中长期被用作有效捕获相关信息的经典技术，提供了对各种噪声类型鲁棒的强先验，同时有效提取语义信息。然而，现代深度学习中这一知识似乎被遗忘了。

现有方法的局限性

过去将边缘检测技术集成到深度学习领域的尝试失败的主要原因包括：

将边缘滤波器应用于图像虽然提供了对扰动的鲁棒性，但会导致细粒度图像细节的丢失
经典边缘检测仅限于图像领域，难以在处理多样化数据模态的现代深度学习中普遍应用

本文贡献

本文将边缘滤波器的概念推广到深度特征，可以直接应用于深层而非输入层，结合了传统边缘滤波器和深度学习的优势，构建了对扰动和领域偏移鲁棒的模型。

核心贡献

提出了Deep Edge Filter：一种基于人类直觉构建的滤波器，可以以模态无关的方式应用于深度神经网络的特征，促进可泛化特征的提取
跨架构和跨模态验证：为CNN和ViT架构提出了Edge Filter，并在图像、文本、3D和音频等多种模态的泛化关键任务上实证证明了滤波器的有效性
理论分析和实证验证：通过层稀疏性和频率分解的视角分析实验结果，并提供了关于深度特征Edge Filter的广泛消融研究

方法详解

核心假设

作者提出了一个关键假设：深度网络在高频分量中编码任务相关的语义特征，在低频分量中编码领域特定的偏置。如果这个假设成立，那么推广Edge Filter（本质上作为高通滤波器）应该有助于分离可泛化的特征。

Deep Edge Filter定义

Edge Filter被定义为通过减去低通滤波(LPF)结果从原始深度特征h得到的残差：

F_edge(h) = h - LPF(h)

其中LPF表示应用于h的低通滤波器，如均值、中值或高斯核。

特征分解理论

设h ∈ R^d为深度网络隐藏层的特征向量，假设特征可以加性分解为：

h = h_sem + h_dom

其中：

h_sem编码可泛化的、任务相关的语义特征
h_dom表示领域特定的偏置，如照明、分辨率或背景纹理

稀疏编码视角

在提出的特征分解和频率假设下：

LPF(h) ≈ h_dom ⇒ F_edge(h) ≈ h_sem

这种通过频率滤波来细化特征的方法与稀疏编码的原理强烈共鸣，通过边缘滤波去除h中的低频、领域特定冗余，本质上简化了需要表示的信号。

架构适配

CNN架构：使用2D Edge Filter，因为CNN天然处理像素间的垂直和水平空间关系
MLP和Transformer架构：使用1D Edge Filter，因为这些架构不固有地处理空间关系

实验设置

数据集和任务选择

作者选择了四个具有不同特征的模态进行实验：

视觉领域：测试时适应(TTA)任务
- CIFAR10-C/100-C和ImageNet200-C基准
- 使用WRN28-10、ResNet18和ViT-B/32架构
语言领域：情感分析任务
- GLUE基准的子任务：SST-2、QQP、QNLI
- 使用12层Transformer(BERT架构)
3D领域：少样本神经辐射场
- Blender数据集，8视图少样本设置
- 评估指标：PSNR、SSIM、LPIPS、MAE
音频领域：音频分类
- UrbanSound8K数据集
- 三个卷积块的CNN架构