Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
論文ID : 2510.11478タイトル : Numerical Methods for Kernel Slicing著者 : Nicolaj Rux (ケムニッツ工科大学)、Johannes Hertrich (パリ・ドーフィーヌ大学-PSL およびInria Mokaplan)、Sebastian Neumayer (ケムニッツ工科大学)分類 : math.NA, cs.NA発表日 : 2025年10月14日論文リンク : https://arxiv.org/abs/2510.11478v1 カーネル関数は機械学習における相互作用関係のモデル化に不可欠である。しかし、関連するカーネル関数の総和の直接計算の計算複雑度はサンプル数に対して二次的に増加する。最近のフーリエスライシング法は、カーネル関数がスライス可能であり、そのフーリエ係数が既知である場合、複雑度を線形に削減できる。これらの係数を得るため、本論文はスライシング関係を逆問題として扱い、2つの復元アルゴリズムを提案する。大規模な数値実験により、提案手法の速度と精度が実証されている。
カーネル法は機械学習において密度推定、サポートベクトルマシン分類、主成分分析、最大平均乖離度(MMD)などのタスクに広く応用されている。これらの応用の計算ボトルネックは通常、以下の形式の式の評価である:
s m : = ∑ n = 1 N F ( ∥ x n − y m ∥ ) w n , m = 1 , … , M s_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M s m := ∑ n = 1 N F ( ∥ x n − y m ∥ ) w n , m = 1 , … , M
ここでF ∈ C ( [ 0 , ∞ ) ) F \in C([0,\infty)) F ∈ C ([ 0 , ∞ )) は動径基底関数、x 1 , … , x N , y 1 , … , y M ∈ R d x_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d x 1 , … , x N , y 1 , … , y M ∈ R d はサンプル点、w ∈ R N w \in \mathbb{R}^N w ∈ R N は重みである。
直接計算にはO ( N M d ) O(NMd) O ( NM d ) 回の演算が必要であり、大規模データセットに対しては実行不可能である。高速フーリエ総和や高速多重極法などの古典的手法は複雑度をO ( M + N ) O(M+N) O ( M + N ) に削減できるが、高速フーリエ変換または空間分割に依存するため、次元d > 4 d > 4 d > 4 の場合に指数的な依存性が生じ、実用的ではない。
スライシングアルゴリズムの基本的な考え方は、以下を満たす関数f ∈ L l o c 1 ( [ 0 , ∞ ) ) f \in L^1_{loc}([0,\infty)) f ∈ L l oc 1 ([ 0 , ∞ )) を探すことである:
F ( ∥ x ∥ ) = 1 ω d − 1 ∫ S d − 1 f ( ∣ ⟨ ξ , x ⟩ ∣ ) d ξ F(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi F ( ∥ x ∥ ) = ω d − 1 1 ∫ S d − 1 f ( ∣ ⟨ ξ , x ⟩ ∣ ) d ξ
ここでω d − 1 = 2 π d / 2 / Γ ( d / 2 ) \omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2) ω d − 1 = 2 π d /2 /Γ ( d /2 ) はd d d 次元球面の表面測度である。積分を離散化することにより、カーネル総和は1次元の場合に簡略化され、高速フーリエ総和を用いて効率的に計算できる。
スライシング関数復元問題を逆問題として形式化 し、完全な理論的枠組みを確立2つの数値アルゴリズムを提案 し、高速フーリエ総和に必要なコサイン級数係数を復元厳密な誤差推定を提供 し、前向き誤差とスライシング誤差の分析を含む広範な数値実験 により、様々なカーネル関数における手法の効率性と精度を検証手法の適用範囲を拡張 し、解析的知識なしに未知のスライシング関数を持つカーネルを処理動径基底関数F : [ 0 , ∞ ) → R F: [0,\infty) \to \mathbb{R} F : [ 0 , ∞ ) → R が与えられたとき、スライシング関係F = S d [ f ] F = S_d[f] F = S d [ f ] を満たす関数f : [ 0 , ∞ ) → R f: [0,\infty) \to \mathbb{R} f : [ 0 , ∞ ) → R を探す。ここでS d S_d S d は一般化されたRiemann-Liouville分数積分演算子である:
S d [ f ] ( s ) = ∫ 0 1 f ( t s ) ϱ d ( t ) d t S_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt S d [ f ] ( s ) = ∫ 0 1 f ( t s ) ϱ d ( t ) d t
ここでϱ d ( t ) : = c d ( 1 − t 2 ) ( d − 3 ) / 2 \varrho_d(t) := c_d(1-t^2)^{(d-3)/2} ϱ d ( t ) := c d ( 1 − t 2 ) ( d − 3 ) /2 、c d : = 2 Γ ( d / 2 ) π Γ ( ( d − 1 ) / 2 ) c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)} c d := π Γ (( d − 1 ) /2 ) 2Γ ( d /2 ) である。
スライシング関数復元を正則化最小化問題に変換する:
a ^ = arg min a ∈ R K ∥ S d [ f a ] − F ∥ H 2 + τ 2 ∥ f a ∥ G 2 \hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2 a ^ = arg min a ∈ R K ∥ S d [ f a ] − F ∥ H 2 + τ 2 ∥ f a ∥ G 2
ここでf a = C − 1 [ a ] f_a = C^{-1}[a] f a = C − 1 [ a ] はK K K 項コサイン級数である:
f a ( t ) = a 0 + 2 ∑ k = 1 K − 1 a k cos ( π k t ) f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt) f a ( t ) = a 0 + 2 ∑ k = 1 K − 1 a k cos ( πk t )
行列構築 :h k : = S d [ g k ] h_k := S_d[g_k] h k := S d [ g k ] を計算。ここでg k g_k g k はコサイン基底関数離散化 :Gauss-Legendre求積法を用いて積分を近似求解 :最小二乗問題∥ H ^ T a − b ^ ∥ 2 2 + τ 2 ∥ D a ∥ 2 2 \|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2 ∥ H ^ T a − b ^ ∥ 2 2 + τ 2 ∥ D a ∥ 2 2 を解く演算子表現 :演算子S : = C ∘ S d ∘ C − 1 S := C \circ S_d \circ C^{-1} S := C ∘ S d ∘ C − 1 の行列表現を構築係数計算 :関係S j , k = S d [ sinc ( ⋅ + j ) + sinc ( ⋅ − j ) ] ( k ) S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k) S j , k = S d [ sinc ( ⋅ + j ) + sinc ( ⋅ − j )] ( k ) を利用最適化求解 :周波数領域空間で正則化問題を解く理論的基礎 :異なる関数空間上のスライシング演算子S d S_d S d の有界性理論を確立数値安定性 :Tikhonov正則化により病態問題を処理誤差分解 :総誤差を前向き誤差とスライシング誤差の2つの部分に分解収束性分析 :関数の滑らかさの仮定の下での収束率を証明複数の動径基底関数を用いてテストを実施:
ガウス : F ( s ) = exp ( − s 2 / ( 2 c 2 ) ) F(s) = \exp(-s^2/(2c^2)) F ( s ) = exp ( − s 2 / ( 2 c 2 )) ラプラス : F ( s ) = exp ( − c ∣ s ∣ ) F(s) = \exp(-c|s|) F ( s ) = exp ( − c ∣ s ∣ ) 逆多二次関数(IMQ) : F ( s ) = ( c 2 + s 2 ) − 1 / 2 F(s) = (c^2 + s^2)^{-1/2} F ( s ) = ( c 2 + s 2 ) − 1/2 薄板スプライン(TPS) : F ( s ) = ( c s ) 2 log ( ∣ c s ∣ ) F(s) = (cs)^2\log(|cs|) F ( s ) = ( cs ) 2 log ( ∣ cs ∣ ) 対数カーネル(LOG) : F ( s ) = log ( ∣ c s ∣ ) F(s) = \log(|cs|) F ( s ) = log ( ∣ cs ∣ ) バンプ関数 および多二次関数(MQ) 前向き誤差 :∣ F K ( s ) − F ( s ) ∣ |F_K(s) - F(s)| ∣ F K ( s ) − F ( s ) ∣ 相対L2誤差 :∥ s − s ^ ∥ 2 / ∥ s ∥ 2 \|s - \hat{s}\|_2/\|s\|_2 ∥ s − s ^ ∥ 2 /∥ s ∥ 2 実行時間比較 直接法 :解析解f = S d − 1 [ F ] f = S_d^{-1}[F] f = S d − 1 [ F ] が既知の場合の打ち切りフーリエ級数PyKeOps :高度に最適化されたGPU暴力計算パッケージ3つの構成 :S-L2-H1、F-L2-H1、F-H1-H1L = 2 10 L = 2^{10} L = 2 10 個の求積点を使用領域内K = 2 8 K = 2^8 K = 2 8 個のコサイン係数、値域内J = 2 10 J = 2^{10} J = 2 10 個 正則化パラメータτ ∈ { 10 − 6 , 10 − 7 , 10 − 4 } \tau \in \{10^{-6}, 10^{-7}, 10^{-4}\} τ ∈ { 1 0 − 6 , 1 0 − 7 , 1 0 − 4 } ラプラス関数とバンプ関数について、前向き誤差∣ F K ( s ) − F ( s ) ∣ |F_K(s) - F(s)| ∣ F K ( s ) − F ( s ) ∣ は区間[ 0 , 1 ] [0,1] [ 0 , 1 ] 全体で10 − 2 10^{-2} 1 0 − 2 未満であり、関数が不規則な領域(例えばs = 0 s=0 s = 0 でのラプラス関数)では誤差がやや大きい。
d = 1000 d=1000 d = 1000 次元、N = M = 10 4 N=M=10^4 N = M = 1 0 4 サンプルのテストにおいて:
関数 S-L2-H1 F-L2-H1 F-H1-H1 Direct ガウス 6.53×10⁻³ 6.62×10⁻³ 6.61×10⁻³ 6.56×10⁻³ ラプラス 8.58×10⁻³ 8.32×10⁻³ 1.30×10⁻² 5.90×10⁻³ IMQ 2.25×10⁻³ 2.27×10⁻³ 2.28×10⁻³ 2.26×10⁻³ LOG 1.00×10⁻¹ 1.80×10⁻¹ 1.55×10⁻¹ 2.98×10¹
計算オーバーヘッド :係数計算時間は約0.1秒(GPU)から1.3秒(CPU)加速効果 :N ≥ 3 × 10 3 N \geq 3 \times 10^3 N ≥ 3 × 1 0 3 の場合、高速総和法が暴力法を上回り始める顕著な加速 :N = 5 × 10 4 N = 5 \times 10^4 N = 5 × 1 0 4 サンプルに対して約50倍の加速を実現正則化パラメータτ \tau τ の選択は極めて重要である:
小さすぎるτ \tau τ は数値不安定性を招く 大きすぎるτ \tau τ は過度な正則化を招く 最適値は通常10 − 6 10^{-6} 1 0 − 6 から10 − 4 10^{-4} 1 0 − 4 の範囲内 Wasserstein距離のランダム1次元投影に最初に出現 MMDなどのカーネル度量に拡張 ランダムフーリエ特徴と密接に関連しているがより汎用的 従来の手法:非等間隔高速フーリエ変換、高速多重極法 高次元の課題:次元の呪いが従来の手法の適用性を制限 GPU実装:KeOpsなどは中程度の次元でも競争力を保つ スライシング関係は調和解析と分数微積分において複数の名称を持つ:
随伴Radon変換 一般化されたRiemann-Liouville分数積分 Erdelyi-Kober積分の特殊ケース 理論的貢献 :演算子ノルム推定と誤差界を含む完全なスライシング演算子理論を確立数値法 :提案された2つのアルゴリズムは未知のスライシング関数の係数を効果的に復元できる実用的価値 :高次元の場合において暴力計算を大幅に上回り、大規模応用に適している次元依存性 :複雑度は改善されたが、依然としてO ( d P ) O(dP) O ( d P ) の計算量が必要正則化感度 :正則化パラメータの慎重な調整が必要滑らかさ要件 :収束性分析は関数の滑らかさの仮定に依存適応的パラメータ選択 :正則化パラメータを自動選択する手法の開発より効率的な求積 :精度を向上させるための専門的な求積規則の探索応用の拡張 :具体的な機械学習タスクにおける手法の実用性の検証理論の厳密性 :演算子の有界性と収束性分析を含む完全な関数解析の理論的枠組みを提供方法の実用性 :2つのアルゴリズムはそれぞれ利点を持ち、空間領域法は直感的、周波数領域法は理論的に優雅実験の包括性 :滑らかな関数から非滑らかな関数まで複数のカーネル関数をテストし、手法の堅牢性を検証性能の優秀性 :精度を保ちながら顕著な計算加速を実現パラメータ調整 :正則化パラメータの選択に経験が必要であり、自動化手法が不足メモリ要件 :行列保存は極めて高次元の場合にボトルネックになる可能性特殊ケースの処理 :特定の病態カーネル関数(例えばLOG)に対しては手法の性能が限定的学術的価値 :高次元カーネル法に新しい理論的ツールと数値技術を提供実用的意義 :機械学習の大規模応用において重要な価値を持つ再現性 :オープンソースコードを提供し、研究者による使用と拡張を容易にする大規模機械学習 :特にサンプル数が多く次元が高いカーネル法の応用に適している科学計算 :高効率なカーネル総和が必要な数値シミュレーションに広い応用の可能性リアルタイムシステム :係数を事前計算した後、高速なオンライン推論を実現可能論文は52篇の関連文献を引用しており、カーネル法、高速アルゴリズム、調和解析など複数の分野の重要な研究をカバーし、研究に堅実な理論的基礎を提供している。