2025-11-15T09:01:12.242557

Numerical Methods for Kernel Slicing

Rux, Hertrich, Neumayer
Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
academic

Numerical Methods for Kernel Slicing

基本信息

  • 论文ID: 2510.11478
  • 标题: Numerical Methods for Kernel Slicing
  • 作者: Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL and Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)
  • 分类: math.NA, cs.NA
  • 发表时间: October 14, 2025
  • 论文链接: https://arxiv.org/abs/2510.11478v1

摘要

核函数在机器学习中对建模交互关系至关重要。然而,相关核函数求和的暴力计算复杂度随样本数量呈二次增长。最近的傅里叶切片方法可以将复杂度降低到线性,前提是核函数可以被切片且其傅里叶系数已知。为获得这些系数,本文将切片关系视为逆问题,提出了两种恢复算法。大量数值实验证明了方法的速度和准确性。

研究背景与动机

核心问题

核方法在机器学习中广泛应用于密度估计、支持向量机分类、主成分分析、最大均值差异(MMD)等任务。这些应用的计算瓶颈通常是评估如下形式的表达式:

sm:=n=1NF(xnym)wn,m=1,,Ms_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M

其中FC([0,))F \in C([0,\infty))是径向基函数,x1,,xN,y1,,yMRdx_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d是样本点,wRNw \in \mathbb{R}^N是权重。

计算复杂性挑战

直接计算需要O(NMd)O(NMd)次操作,对于大数据集不可行。经典方法如快速傅里叶求和和快速多极方法虽然能将复杂度降低到O(M+N)O(M+N),但由于依赖快速傅里叶变换或空间分割,在维度d>4d > 4时会出现指数依赖,使其不可行。

切片算法的优势

切片算法的基本思想是寻找函数fLloc1([0,))f \in L^1_{loc}([0,\infty))使得:

F(x)=1ωd1Sd1f(ξ,x)dξF(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi

其中ωd1=2πd/2/Γ(d/2)\omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2)dd维球面的表面测度。通过离散化积分,核求和可以简化为一维情况,使用快速傅里叶求和高效计算。

核心贡献

  1. 将切片函数恢复问题形式化为逆问题,建立了完整的理论框架
  2. 提出两种数值算法用于恢复快速傅里叶求和所需的余弦级数系数
  3. 提供严格的误差估计,包括前向误差和切片误差的分析
  4. 广泛的数值实验验证了方法在各种核函数上的效率和准确性
  5. 扩展了方法的适用范围,无需解析知识即可处理未知切片函数的核

方法详解

任务定义

给定径向基函数F:[0,)RF: [0,\infty) \to \mathbb{R},寻找函数f:[0,)Rf: [0,\infty) \to \mathbb{R}使得切片关系F=Sd[f]F = S_d[f]成立,其中SdS_d是广义Riemann-Liouville分数积分算子:

Sd[f](s)=01f(ts)ϱd(t)dtS_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt

其中ϱd(t):=cd(1t2)(d3)/2\varrho_d(t) := c_d(1-t^2)^{(d-3)/2}cd:=2Γ(d/2)πΓ((d1)/2)c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)}

模型架构

1. 优化问题构建

将切片函数恢复转化为正则化最小化问题:

a^=argminaRKSd[fa]FH2+τ2faG2\hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2

其中fa=C1[a]f_a = C^{-1}[a]KK项余弦级数:

fa(t)=a0+2k=1K1akcos(πkt)f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt)

2. 空间域方法(算法1)

  • 矩阵构建:计算hk:=Sd[gk]h_k := S_d[g_k],其中gkg_k是余弦基函数
  • 离散化:使用Gauss-Legendre求积法近似积分
  • 求解:解决最小二乘问题H^Tab^22+τ2Da22\|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2

3. 频域方法(算法2)

  • 算子表示:构建算子S:=CSdC1S := C \circ S_d \circ C^{-1}的矩阵表示
  • 系数计算:利用关系Sj,k=Sd[sinc(+j)+sinc(j)](k)S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k)
  • 优化求解:在频域空间中求解正则化问题

技术创新点

  1. 理论基础:建立了切片算子SdS_d在不同函数空间上的有界性理论
  2. 数值稳定性:通过Tikhonov正则化处理病态问题
  3. 误差分解:将总误差分解为前向误差和切片误差两部分
  4. 收敛性分析:证明了在函数光滑性假设下的收敛率

实验设置

数据集

使用多种径向基函数进行测试:

  • Gauss: F(s)=exp(s2/(2c2))F(s) = \exp(-s^2/(2c^2))
  • Laplace: F(s)=exp(cs)F(s) = \exp(-c|s|)
  • 逆多二次函数(IMQ): F(s)=(c2+s2)1/2F(s) = (c^2 + s^2)^{-1/2}
  • 薄板样条(TPS): F(s)=(cs)2log(cs)F(s) = (cs)^2\log(|cs|)
  • 对数核(LOG): F(s)=log(cs)F(s) = \log(|cs|)
  • Bump函数多二次函数(MQ)

评价指标

  • 前向误差FK(s)F(s)|F_K(s) - F(s)|
  • 相对L2误差ss^2/s2\|s - \hat{s}\|_2/\|s\|_2
  • 运行时间比较

对比方法

  • 直接方法:当解析解f=Sd1[F]f = S_d^{-1}[F]已知时的截断傅里叶级数
  • PyKeOps:高度优化的GPU暴力计算包
  • 三种配置:S-L2-H1, F-L2-H1, F-H1-H1

实现细节

  • 使用L=210L = 2^{10}个求积点
  • 域中K=28K = 2^8个余弦系数,值域中J=210J = 2^{10}
  • 正则化参数τ{106,107,104}\tau \in \{10^{-6}, 10^{-7}, 10^{-4}\}

实验结果

主要结果

前向误差分析

对于Laplace和Bump函数,前向误差FK(s)F(s)|F_K(s) - F(s)|在整个区间[0,1][0,1]上均小于10210^{-2},在函数不规则区域(如s=0s=0处的Laplace函数)误差稍大。

快速核求和精度

d=1000d=1000维,N=M=104N=M=10^4样本的测试中:

函数S-L2-H1F-L2-H1F-H1-H1Direct
Gauss6.53×10⁻³6.62×10⁻³6.61×10⁻³6.56×10⁻³
Laplace8.58×10⁻³8.32×10⁻³1.30×10⁻²5.90×10⁻³
IMQ2.25×10⁻³2.27×10⁻³2.28×10⁻³2.26×10⁻³
LOG1.00×10⁻¹1.80×10⁻¹1.55×10⁻¹2.98×10¹

运行时间比较

  • 计算开销:系数计算时间约0.1秒(GPU)到1.3秒(CPU)
  • 加速效果:当N3×103N \geq 3 \times 10^3时,快速求和方法开始超越暴力方法
  • 显著加速:对N=5×104N = 5 \times 10^4样本,实现约50倍加速

消融实验

正则化参数τ\tau的选择至关重要:

  • 过小的τ\tau导致数值不稳定
  • 过大的τ\tau导致过度正则化
  • 最优值通常在10610^{-6}10410^{-4}范围内

相关工作

切片方法发展

  • 最初出现在Wasserstein距离的随机一维投影中
  • 扩展到MMD等核度量
  • 与随机傅里叶特征密切相关但更加通用

快速核求和方法

  • 传统方法:非等间距快速傅里叶变换、快速多极方法
  • 高维挑战:维度灾难限制了传统方法的适用性
  • GPU实现:KeOps等在中等维度下仍有竞争力

理论基础

切片关系在调和分析和分数微积分中有多个名称:

  • 伴随Radon变换
  • 广义Riemann-Liouville分数积分
  • Erdelyi-Kober积分的特殊情况

结论与讨论

主要结论

  1. 理论贡献:建立了完整的切片算子理论,包括算子范数估计和误差界
  2. 数值方法:提出的两种算法能够有效恢复未知切片函数的系数
  3. 实用价值:方法在高维情况下显著优于暴力计算,适用于大规模应用

局限性

  1. 维度依赖:虽然改善了复杂度,但仍需要O(dP)O(dP)的计算量
  2. 正则化敏感性:需要仔细调节正则化参数
  3. 光滑性要求:收敛性分析依赖于函数的光滑性假设

未来方向

  1. 自适应参数选择:开发自动选择正则化参数的方法
  2. 更高效的求积:探索专门的求积规则以提高精度
  3. 应用拓展:在具体机器学习任务中验证方法的实用性

深度评价

优点

  1. 理论严谨:提供了完整的函数分析理论框架,包括算子有界性和收敛性分析
  2. 方法实用:两种算法各有优势,空间域方法直观,频域方法理论优雅
  3. 实验全面:测试了多种核函数,从光滑到非光滑,验证了方法的鲁棒性
  4. 性能优异:在保持精度的同时实现了显著的计算加速

不足

  1. 参数调节:正则化参数的选择需要经验,缺乏自动化方法
  2. 内存需求:矩阵存储可能在极高维情况下成为瓶颈
  3. 特殊情况处理:对于某些病态核函数(如LOG),方法性能有限

影响力

  1. 学术价值:为高维核方法提供了新的理论工具和数值技术
  2. 实用意义:在机器学习的大规模应用中具有重要价值
  3. 可复现性:提供了开源代码,便于研究者使用和扩展

适用场景

  • 大规模机器学习:特别适用于样本量大、维度高的核方法应用
  • 科学计算:在需要高效核求和的数值模拟中有广泛应用前景
  • 实时系统:预计算系数后可实现快速在线推理

参考文献

论文引用了52篇相关文献,涵盖了核方法、快速算法、调和分析等多个领域的重要工作,为研究提供了坚实的理论基础。