2025-11-15T09:01:12.242557

Numerical Methods for Kernel Slicing

Rux, Hertrich, Neumayer

Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.

academic

Numerische Methoden für Kernel-Slicing

Grundinformationen

Paper-ID: 2510.11478
Titel: Numerical Methods for Kernel Slicing
Autoren: Nicolaj Rux (Technische Universität Chemnitz), Johannes Hertrich (Université Paris Dauphine-PSL und Inria Mokaplan), Sebastian Neumayer (Technische Universität Chemnitz)
Klassifizierung: math.NA, cs.NA
Veröffentlichungsdatum: 14. Oktober 2025
Paper-Link: https://arxiv.org/abs/2510.11478v1

Zusammenfassung

Kernfunktionen sind für die Modellierung von Wechselwirkungen im maschinellen Lernen von entscheidender Bedeutung. Die brute-force-Berechnung der relevanten Kernsummen weist jedoch eine quadratische Komplexität in Bezug auf die Stichprobengröße auf. Kürzliche Fourier-Slicing-Methoden können die Komplexität auf linear reduzieren, vorausgesetzt, die Kernfunktion ist slicebar und ihre Fourier-Koeffizienten sind bekannt. Um diese Koeffizienten zu erhalten, wird die Slicing-Beziehung in dieser Arbeit als inverses Problem behandelt und zwei Wiederherstellungsalgorithmen werden vorgeschlagen. Umfangreiche numerische Experimente demonstrieren die Geschwindigkeit und Genauigkeit der Methode.

Forschungshintergrund und Motivation

Kernproblem

Kernmethoden werden im maschinellen Lernen weit verbreitet für Dichteabschätzung, Support-Vector-Machine-Klassifizierung, Hauptkomponentenanalyse, Maximum Mean Discrepancy (MMD) und andere Aufgaben verwendet. Der Rechnenengpass dieser Anwendungen liegt typischerweise in der Auswertung von Ausdrücken der Form:

$s_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M$

wobei $F \in C([0,\infty))$ eine radiale Basisfunktion ist, $x_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d$ Stichprobenpunkte sind und $w \in \mathbb{R}^N$ Gewichte sind.

Herausforderungen der Rechenkomplexität

Die direkte Berechnung erfordert $O(NMd)$ Operationen, was für große Datensätze nicht praktikabel ist. Klassische Methoden wie schnelle Fourier-Summation und schnelle Multipol-Methoden können zwar die Komplexität auf $O(M+N)$ reduzieren, zeigen aber aufgrund ihrer Abhängigkeit von der schnellen Fourier-Transformation oder räumlicher Zerlegung eine exponentielle Abhängigkeit von der Dimension $d > 4$ , was sie unpraktikabel macht.

Vorteile des Slicing-Algorithmus

Die grundlegende Idee des Slicing-Algorithmus besteht darin, eine Funktion $f \in L^1_{loc}([0,\infty))$ zu finden, so dass:

$F(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi$

wobei $\omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2)$ das Oberflächenmaß der $d$ -dimensionalen Sphäre ist. Durch Diskretisierung des Integrals kann die Kernsumme auf den eindimensionalen Fall vereinfacht werden, wobei die schnelle Fourier-Summation für effiziente Berechnungen verwendet wird.

Kernbeiträge

Formalisierung des Wiederherstellungsproblems der Slicing-Funktion als inverses Problem mit vollständigem theoretischem Rahmen
Vorschlag von zwei numerischen Algorithmen zur Wiederherstellung der für die schnelle Fourier-Summation erforderlichen Kosinusreihen-Koeffizienten
Bereitstellung strenger Fehlerabschätzungen, einschließlich Analyse von Vorwärtsfehler und Slicing-Fehler
Umfangreiche numerische Experimente zur Validierung der Effizienz und Genauigkeit der Methode auf verschiedenen Kernfunktionen
Erweiterung des Anwendungsbereichs zur Behandlung von Kernen mit unbekannten Slicing-Funktionen ohne analytisches Wissen

Methodische Details

Aufgabendefinition

Gegeben eine radiale Basisfunktion $F: [0,\infty) \to \mathbb{R}$ , finde eine Funktion $f: [0,\infty) \to \mathbb{R}$ , so dass die Slicing-Beziehung $F = S_d[f]$ erfüllt ist, wobei $S_d$ der verallgemeinerte Riemann-Liouville-Bruchintegraloperator ist:

$S_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt$

wobei $\varrho_d(t) := c_d(1-t^2)^{(d-3)/2}$ , $c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)}$ .

Modellarchitektur

1. Konstruktion des Optimierungsproblems

Die Wiederherstellung der Slicing-Funktion wird in ein regularisiertes Minimierungsproblem umgewandelt:

$\hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2$

wobei $f_a = C^{-1}[a]$ eine $K$ -Term-Kosinusreihe ist:

$f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt)$

2. Raumbereichs-Methode (Algorithmus 1)

Matrixkonstruktion: Berechnung von $h_k := S_d[g_k]$ , wobei $g_k$ Kosinusbasis-Funktionen sind
Diskretisierung: Verwendung der Gauss-Legendre-Quadraturformel zur Approximation des Integrals
Lösung: Lösung des Kleinste-Quadrate-Problems $\|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2$

3. Frequenzbereichs-Methode (Algorithmus 2)

Operatordarstellung: Konstruktion der Matrixdarstellung des Operators $S := C \circ S_d \circ C^{-1}$
Koeffizientenberechnung: Nutzung der Beziehung $S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k)$
Optimierungslösung: Lösung des regularisierten Problems im Frequenzbereichs-Raum

Technische Innovationen

Theoretische Grundlagen: Etablierung der Beschränktheit des Slicing-Operators $S_d$ auf verschiedenen Funktionsräumen
Numerische Stabilität: Behandlung schlecht konditionierter Probleme durch Tikhonov-Regularisierung
Fehlerzerlegung: Zerlegung des Gesamtfehlers in Vorwärtsfehler und Slicing-Fehler
Konvergenzanalyse: Beweis von Konvergenzraten unter Glattheitsannahmen

Experimentelle Einrichtung

Datensätze

Tests mit verschiedenen radialen Basisfunktionen:

Gauss: $F(s) = \exp(-s^2/(2c^2))$
Laplace: $F(s) = \exp(-c|s|)$
Inverse Multiquadric (IMQ): $F(s) = (c^2 + s^2)^{-1/2}$
Thin Plate Spline (TPS): $F(s) = (cs)^2\log(|cs|)$
Logarithmischer Kern (LOG): $F(s) = \log(|cs|)$
Bump-Funktion und Multiquadric (MQ)

Bewertungsmetriken

Vorwärtsfehler: $|F_K(s) - F(s)|$
Relativer L2-Fehler: $\|s - \hat{s}\|_2/\|s\|_2$
Laufzeitvergleich

Vergleichsmethoden

Direkte Methode: Abgeschnittene Fourier-Reihe, wenn die analytische Lösung $f = S_d^{-1}[F]$ bekannt ist
PyKeOps: Hochoptimiertes GPU-Brute-Force-Berechnungspaket
Drei Konfigurationen: S-L2-H1, F-L2-H1, F-H1-H1

Implementierungsdetails

Verwendung von $L = 2^{10}$ Quadraturpunkten
$K = 2^8$ Kosinuskoeffizienten im Bereich, $J = 2^{10}$ im Wertebereich
Regularisierungsparameter $\tau \in \{10^{-6}, 10^{-7}, 10^{-4}\}$

Experimentelle Ergebnisse

Hauptergebnisse

Vorwärtsfehleranalyse

Für Laplace- und Bump-Funktionen liegt der Vorwärtsfehler $|F_K(s) - F(s)|$ über das gesamte Intervall $[0,1]$ unter $10^{-2}$ , mit etwas größeren Fehlern in unregelmäßigen Funktionsbereichen (wie bei $s=0$ für die Laplace-Funktion).

Genauigkeit der schnellen Kernsummation

In Tests mit $d=1000$ Dimensionen und $N=M=10^4$ Stichproben:

Funktion	S-L2-H1	F-L2-H1	F-H1-H1	Direkt
Gauss	6,53×10⁻³	6,62×10⁻³	6,61×10⁻³	6,56×10⁻³
Laplace	8,58×10⁻³	8,32×10⁻³	1,30×10⁻²	5,90×10⁻³
IMQ	2,25×10⁻³	2,27×10⁻³	2,28×10⁻³	2,26×10⁻³
LOG	1,00×10⁻¹	1,80×10⁻¹	1,55×10⁻¹	2,98×10¹

Laufzeitvergleich

Rechenlast: Koeffizientenberechnungszeit etwa 0,1 Sekunden (GPU) bis 1,3 Sekunden (CPU)
Beschleunigungseffekt: Schnelle Summationsmethode übertrifft Brute-Force-Methode ab $N \geq 3 \times 10^3$
Signifikante Beschleunigung: Etwa 50-fache Beschleunigung für $N = 5 \times 10^4$ Stichproben

Ablationsstudien

Die Wahl des Regularisierungsparameters $\tau$ ist entscheidend:

Zu kleines $\tau$ führt zu numerischer Instabilität
Zu großes $\tau$ führt zu Überregularisierung
Optimale Werte liegen typischerweise im Bereich $10^{-6}$ bis $10^{-4}$

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Theoretischer Beitrag: Etablierung einer vollständigen Theorie des Slicing-Operators, einschließlich Operatornorm-Abschätzungen und Fehlerschranken
Numerische Methoden: Die vorgeschlagenen zwei Algorithmen können Koeffizienten unbekannter Slicing-Funktionen effektiv wiederherstellen
Praktischer Wert: Die Methode ist in hochdimensionalen Fällen deutlich überlegen gegenüber Brute-Force-Berechnung und eignet sich für großskalige Anwendungen

Einschränkungen

Dimensionsabhängigkeit: Obwohl die Komplexität verbessert wird, ist immer noch $O(dP)$ Rechenaufwand erforderlich
Regularisierungsempfindlichkeit: Erfordert sorgfältige Anpassung des Regularisierungsparameters
Glattheitanforderungen: Konvergenzanalyse hängt von Glattheitsannahmen der Funktion ab

Zukünftige Richtungen

Adaptive Parameterauswahl: Entwicklung von Methoden zur automatischen Auswahl des Regularisierungsparameters
Effizientere Quadratur: Erkundung spezialisierter Quadraturregeln zur Verbesserung der Genauigkeit
Anwendungserweiterung: Validierung der praktischen Anwendbarkeit der Methode in konkreten Aufgaben des maschinellen Lernens

Tiefgreifende Bewertung

Stärken

Theoretische Strenge: Bereitstellung eines vollständigen funktionalanalytischen Rahmens, einschließlich Operatorbeschränktheit und Konvergenzanalyse
Praktische Methoden: Zwei Algorithmen mit jeweiligen Vorteilen; Raumbereichs-Methode ist intuitiv, Frequenzbereichs-Methode theoretisch elegant
Umfassende Experimente: Tests mit verschiedenen Kernfunktionen von glatt bis nicht-glatt, Validierung der Robustheit der Methode
Ausgezeichnete Leistung: Signifikante Rechenbeschleunigung bei Beibehaltung der Genauigkeit

Mängel

Parametereinstellung: Auswahl des Regularisierungsparameters erfordert Erfahrung, fehlende Automatisierungsmethoden
Speicheranforderungen: Matrixspeicherung kann in extrem hochdimensionalen Fällen zum Engpass werden
Behandlung von Spezialfällen: Begrenzte Methodenleistung für bestimmte schlecht konditionierte Kernfunktionen (wie LOG)

Auswirkungen

Akademischer Wert: Bereitstellung neuer theoretischer Werkzeuge und numerischer Techniken für hochdimensionale Kernmethoden
Praktische Bedeutung: Wichtiger Wert in großskaligen Anwendungen des maschinellen Lernens
Reproduzierbarkeit: Bereitstellung von Open-Source-Code für einfache Nutzung und Erweiterung durch Forscher

Anwendungsszenarien

Großskaliges maschinelles Lernen: Besonders geeignet für Kernmethoden-Anwendungen mit großen Stichprobenmengen und hohen Dimensionen
Wissenschaftliches Rechnen: Breite Anwendungsperspektiven in numerischen Simulationen, die effiziente Kernsummation erfordern
Echtzeitsysteme: Nach Vorberechnung der Koeffizienten schnelle Online-Inferenz möglich

Literaturverzeichnis

Das Paper zitiert 52 relevante Referenzen, die wichtige Arbeiten aus mehreren Bereichen wie Kernmethoden, schnelle Algorithmen und harmonische Analyse abdecken und eine solide theoretische Grundlage für die Forschung bieten.