Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
论文ID : 2510.11478标题 : Numerical Methods for Kernel Slicing作者 : Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL and Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)分类 : math.NA, cs.NA发表时间 : October 14, 2025论文链接 : https://arxiv.org/abs/2510.11478v1 核函数在机器学习中对建模交互关系至关重要。然而,相关核函数求和的暴力计算复杂度随样本数量呈二次增长。最近的傅里叶切片方法可以将复杂度降低到线性,前提是核函数可以被切片且其傅里叶系数已知。为获得这些系数,本文将切片关系视为逆问题,提出了两种恢复算法。大量数值实验证明了方法的速度和准确性。
核方法在机器学习中广泛应用于密度估计、支持向量机分类、主成分分析、最大均值差异(MMD)等任务。这些应用的计算瓶颈通常是评估如下形式的表达式:
s m : = ∑ n = 1 N F ( ∥ x n − y m ∥ ) w n , m = 1 , … , M s_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M s m := ∑ n = 1 N F ( ∥ x n − y m ∥ ) w n , m = 1 , … , M
其中F ∈ C ( [ 0 , ∞ ) ) F \in C([0,\infty)) F ∈ C ([ 0 , ∞ )) 是径向基函数,x 1 , … , x N , y 1 , … , y M ∈ R d x_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d x 1 , … , x N , y 1 , … , y M ∈ R d 是样本点,w ∈ R N w \in \mathbb{R}^N w ∈ R N 是权重。
直接计算需要O ( N M d ) O(NMd) O ( NM d ) 次操作,对于大数据集不可行。经典方法如快速傅里叶求和和快速多极方法虽然能将复杂度降低到O ( M + N ) O(M+N) O ( M + N ) ,但由于依赖快速傅里叶变换或空间分割,在维度d > 4 d > 4 d > 4 时会出现指数依赖,使其不可行。
切片算法的基本思想是寻找函数f ∈ L l o c 1 ( [ 0 , ∞ ) ) f \in L^1_{loc}([0,\infty)) f ∈ L l oc 1 ([ 0 , ∞ )) 使得:
F ( ∥ x ∥ ) = 1 ω d − 1 ∫ S d − 1 f ( ∣ ⟨ ξ , x ⟩ ∣ ) d ξ F(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi F ( ∥ x ∥ ) = ω d − 1 1 ∫ S d − 1 f ( ∣ ⟨ ξ , x ⟩ ∣ ) d ξ
其中ω d − 1 = 2 π d / 2 / Γ ( d / 2 ) \omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2) ω d − 1 = 2 π d /2 /Γ ( d /2 ) 是d d d 维球面的表面测度。通过离散化积分,核求和可以简化为一维情况,使用快速傅里叶求和高效计算。
将切片函数恢复问题形式化为逆问题 ,建立了完整的理论框架提出两种数值算法 用于恢复快速傅里叶求和所需的余弦级数系数提供严格的误差估计 ,包括前向误差和切片误差的分析广泛的数值实验 验证了方法在各种核函数上的效率和准确性扩展了方法的适用范围 ,无需解析知识即可处理未知切片函数的核给定径向基函数F : [ 0 , ∞ ) → R F: [0,\infty) \to \mathbb{R} F : [ 0 , ∞ ) → R ,寻找函数f : [ 0 , ∞ ) → R f: [0,\infty) \to \mathbb{R} f : [ 0 , ∞ ) → R 使得切片关系F = S d [ f ] F = S_d[f] F = S d [ f ] 成立,其中S d S_d S d 是广义Riemann-Liouville分数积分算子:
S d [ f ] ( s ) = ∫ 0 1 f ( t s ) ϱ d ( t ) d t S_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt S d [ f ] ( s ) = ∫ 0 1 f ( t s ) ϱ d ( t ) d t
其中ϱ d ( t ) : = c d ( 1 − t 2 ) ( d − 3 ) / 2 \varrho_d(t) := c_d(1-t^2)^{(d-3)/2} ϱ d ( t ) := c d ( 1 − t 2 ) ( d − 3 ) /2 ,c d : = 2 Γ ( d / 2 ) π Γ ( ( d − 1 ) / 2 ) c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)} c d := π Γ (( d − 1 ) /2 ) 2Γ ( d /2 ) 。
将切片函数恢复转化为正则化最小化问题:
a ^ = arg min a ∈ R K ∥ S d [ f a ] − F ∥ H 2 + τ 2 ∥ f a ∥ G 2 \hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2 a ^ = arg min a ∈ R K ∥ S d [ f a ] − F ∥ H 2 + τ 2 ∥ f a ∥ G 2
其中f a = C − 1 [ a ] f_a = C^{-1}[a] f a = C − 1 [ a ] 是K K K 项余弦级数:
f a ( t ) = a 0 + 2 ∑ k = 1 K − 1 a k cos ( π k t ) f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt) f a ( t ) = a 0 + 2 ∑ k = 1 K − 1 a k cos ( πk t )
矩阵构建 :计算h k : = S d [ g k ] h_k := S_d[g_k] h k := S d [ g k ] ,其中g k g_k g k 是余弦基函数离散化 :使用Gauss-Legendre求积法近似积分求解 :解决最小二乘问题∥ H ^ T a − b ^ ∥ 2 2 + τ 2 ∥ D a ∥ 2 2 \|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2 ∥ H ^ T a − b ^ ∥ 2 2 + τ 2 ∥ D a ∥ 2 2 算子表示 :构建算子S : = C ∘ S d ∘ C − 1 S := C \circ S_d \circ C^{-1} S := C ∘ S d ∘ C − 1 的矩阵表示系数计算 :利用关系S j , k = S d [ sinc ( ⋅ + j ) + sinc ( ⋅ − j ) ] ( k ) S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k) S j , k = S d [ sinc ( ⋅ + j ) + sinc ( ⋅ − j )] ( k ) 优化求解 :在频域空间中求解正则化问题理论基础 :建立了切片算子S d S_d S d 在不同函数空间上的有界性理论数值稳定性 :通过Tikhonov正则化处理病态问题误差分解 :将总误差分解为前向误差和切片误差两部分收敛性分析 :证明了在函数光滑性假设下的收敛率使用多种径向基函数进行测试:
Gauss : F ( s ) = exp ( − s 2 / ( 2 c 2 ) ) F(s) = \exp(-s^2/(2c^2)) F ( s ) = exp ( − s 2 / ( 2 c 2 )) Laplace : F ( s ) = exp ( − c ∣ s ∣ ) F(s) = \exp(-c|s|) F ( s ) = exp ( − c ∣ s ∣ ) 逆多二次函数(IMQ) : F ( s ) = ( c 2 + s 2 ) − 1 / 2 F(s) = (c^2 + s^2)^{-1/2} F ( s ) = ( c 2 + s 2 ) − 1/2 薄板样条(TPS) : F ( s ) = ( c s ) 2 log ( ∣ c s ∣ ) F(s) = (cs)^2\log(|cs|) F ( s ) = ( cs ) 2 log ( ∣ cs ∣ ) 对数核(LOG) : F ( s ) = log ( ∣ c s ∣ ) F(s) = \log(|cs|) F ( s ) = log ( ∣ cs ∣ ) Bump函数 和多二次函数(MQ) 前向误差 :∣ F K ( s ) − F ( s ) ∣ |F_K(s) - F(s)| ∣ F K ( s ) − F ( s ) ∣ 相对L2误差 :∥ s − s ^ ∥ 2 / ∥ s ∥ 2 \|s - \hat{s}\|_2/\|s\|_2 ∥ s − s ^ ∥ 2 /∥ s ∥ 2 运行时间比较 直接方法 :当解析解f = S d − 1 [ F ] f = S_d^{-1}[F] f = S d − 1 [ F ] 已知时的截断傅里叶级数PyKeOps :高度优化的GPU暴力计算包三种配置 :S-L2-H1, F-L2-H1, F-H1-H1使用L = 2 10 L = 2^{10} L = 2 10 个求积点 域中K = 2 8 K = 2^8 K = 2 8 个余弦系数,值域中J = 2 10 J = 2^{10} J = 2 10 个 正则化参数τ ∈ { 10 − 6 , 10 − 7 , 10 − 4 } \tau \in \{10^{-6}, 10^{-7}, 10^{-4}\} τ ∈ { 1 0 − 6 , 1 0 − 7 , 1 0 − 4 } 对于Laplace和Bump函数,前向误差∣ F K ( s ) − F ( s ) ∣ |F_K(s) - F(s)| ∣ F K ( s ) − F ( s ) ∣ 在整个区间[ 0 , 1 ] [0,1] [ 0 , 1 ] 上均小于10 − 2 10^{-2} 1 0 − 2 ,在函数不规则区域(如s = 0 s=0 s = 0 处的Laplace函数)误差稍大。
在d = 1000 d=1000 d = 1000 维,N = M = 10 4 N=M=10^4 N = M = 1 0 4 样本的测试中:
函数 S-L2-H1 F-L2-H1 F-H1-H1 Direct Gauss 6.53×10⁻³ 6.62×10⁻³ 6.61×10⁻³ 6.56×10⁻³ Laplace 8.58×10⁻³ 8.32×10⁻³ 1.30×10⁻² 5.90×10⁻³ IMQ 2.25×10⁻³ 2.27×10⁻³ 2.28×10⁻³ 2.26×10⁻³ LOG 1.00×10⁻¹ 1.80×10⁻¹ 1.55×10⁻¹ 2.98×10¹
计算开销 :系数计算时间约0.1秒(GPU)到1.3秒(CPU)加速效果 :当N ≥ 3 × 10 3 N \geq 3 \times 10^3 N ≥ 3 × 1 0 3 时,快速求和方法开始超越暴力方法显著加速 :对N = 5 × 10 4 N = 5 \times 10^4 N = 5 × 1 0 4 样本,实现约50倍加速正则化参数τ \tau τ 的选择至关重要:
过小的τ \tau τ 导致数值不稳定 过大的τ \tau τ 导致过度正则化 最优值通常在10 − 6 10^{-6} 1 0 − 6 到10 − 4 10^{-4} 1 0 − 4 范围内 最初出现在Wasserstein距离的随机一维投影中 扩展到MMD等核度量 与随机傅里叶特征密切相关但更加通用 传统方法:非等间距快速傅里叶变换、快速多极方法 高维挑战:维度灾难限制了传统方法的适用性 GPU实现:KeOps等在中等维度下仍有竞争力 切片关系在调和分析和分数微积分中有多个名称:
伴随Radon变换 广义Riemann-Liouville分数积分 Erdelyi-Kober积分的特殊情况 理论贡献 :建立了完整的切片算子理论,包括算子范数估计和误差界数值方法 :提出的两种算法能够有效恢复未知切片函数的系数实用价值 :方法在高维情况下显著优于暴力计算,适用于大规模应用维度依赖 :虽然改善了复杂度,但仍需要O ( d P ) O(dP) O ( d P ) 的计算量正则化敏感性 :需要仔细调节正则化参数光滑性要求 :收敛性分析依赖于函数的光滑性假设自适应参数选择 :开发自动选择正则化参数的方法更高效的求积 :探索专门的求积规则以提高精度应用拓展 :在具体机器学习任务中验证方法的实用性理论严谨 :提供了完整的函数分析理论框架,包括算子有界性和收敛性分析方法实用 :两种算法各有优势,空间域方法直观,频域方法理论优雅实验全面 :测试了多种核函数,从光滑到非光滑,验证了方法的鲁棒性性能优异 :在保持精度的同时实现了显著的计算加速参数调节 :正则化参数的选择需要经验,缺乏自动化方法内存需求 :矩阵存储可能在极高维情况下成为瓶颈特殊情况处理 :对于某些病态核函数(如LOG),方法性能有限学术价值 :为高维核方法提供了新的理论工具和数值技术实用意义 :在机器学习的大规模应用中具有重要价值可复现性 :提供了开源代码,便于研究者使用和扩展大规模机器学习 :特别适用于样本量大、维度高的核方法应用科学计算 :在需要高效核求和的数值模拟中有广泛应用前景实时系统 :预计算系数后可实现快速在线推理论文引用了52篇相关文献,涵盖了核方法、快速算法、调和分析等多个领域的重要工作,为研究提供了坚实的理论基础。