2025-11-15T09:01:12.242557

Numerical Methods for Kernel Slicing

Rux, Hertrich, Neumayer

Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.

academic

कर्नल स्लाइसिंग के लिए संख्यात्मक विधियाँ

मूल जानकारी

पेपर ID: 2510.11478
शीर्षक: Numerical Methods for Kernel Slicing
लेखक: Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL and Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)
वर्गीकरण: math.NA, cs.NA
प्रकाशन तिथि: 14 अक्टूबर, 2025
पेपर लिंक: https://arxiv.org/abs/2510.11478v1

सारांश

कर्नल फलन मशीन लर्निंग में अंतःक्रिया संबंधों को मॉडल करने के लिए महत्वपूर्ण हैं। हालांकि, संबंधित कर्नल फलन योग की क्रूर गणना की जटिलता नमूना संख्या के साथ द्विघात रूप से बढ़ती है। हाल की फूरियर स्लाइसिंग विधि जटिलता को रैखिक तक कम कर सकती है, बशर्ते कर्नल फलन को स्लाइस किया जा सके और इसके फूरियर गुणांक ज्ञात हों। इन गुणांकों को प्राप्त करने के लिए, यह पेपर स्लाइसिंग संबंध को एक व्युत्क्रम समस्या के रूप में मानता है और दो पुनर्प्राप्ति एल्गोरिदम प्रस्तावित करता है। व्यापक संख्यात्मक प्रयोग विधि की गति और सटीकता को प्रदर्शित करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

मूल समस्या

कर्नल विधियाँ मशीन लर्निंग में घनत्व अनुमान, समर्थन सदिश मशीन वर्गीकरण, प्रमुख घटक विश्लेषण, अधिकतम माध्य विसंगति (MMD) आदि कार्यों में व्यापक रूप से लागू होती हैं। इन अनुप्रयोगों की कम्प्यूटेशनल बाधा आमतौर पर निम्नलिखित रूप की अभिव्यक्ति का मूल्यांकन है:

$s_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M$

जहाँ $F \in C([0,\infty))$ एक रेडियल आधार फलन है, $x_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d$ नमूना बिंदु हैं, और $w \in \mathbb{R}^N$ भार हैं।

कम्प्यूटेशनल जटिलता चुनौती

प्रत्यक्ष गणना के लिए $O(NMd)$ संचालन की आवश्यकता होती है, जो बड़े डेटासेट के लिए अव्यावहारिक है। तीव्र फूरियर योग और तीव्र बहुध्रुव विधि जैसी शास्त्रीय विधियाँ जटिलता को $O(M+N)$ तक कम कर सकती हैं, लेकिन तीव्र फूरियर रूपांतरण या स्थानिक विभाजन पर निर्भरता के कारण, जब $d > 4$ हो तो घातीय निर्भरता दिखाई देती है, जिससे वे अव्यावहारिक हो जाते हैं।

स्लाइसिंग एल्गोरिदम के लाभ

स्लाइसिंग एल्गोरिदम का मूल विचार एक फलन $f \in L^1_{loc}([0,\infty))$ खोजना है जो निम्नलिखित को संतुष्ट करता है:

$F(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi$

जहाँ $\omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2)$ $d$ -आयामी गोले का सतह माप है। समाकलन को विवेकित करके, कर्नल योग को एक-आयामी स्थिति में सरल किया जा सकता है, तीव्र फूरियर योग का उपयोग करके कुशलतापूर्वक गणना की जा सकती है।

मूल योगदान

स्लाइसिंग फलन पुनर्प्राप्ति समस्या को एक व्युत्क्रम समस्या के रूप में औपचारिक रूप दिया, संपूर्ण सैद्धांतिक ढांचा स्थापित किया
दो संख्यात्मक एल्गोरिदम प्रस्तावित किए तीव्र फूरियर योग के लिए आवश्यक कोसाइन श्रृंखला गुणांकों को पुनः प्राप्त करने के लिए
कठोर त्रुटि अनुमान प्रदान किए, अग्रगामी त्रुटि और स्लाइसिंग त्रुटि विश्लेषण सहित
व्यापक संख्यात्मक प्रयोग विभिन्न कर्नल फलनों पर विधि की दक्षता और सटीकता को सत्यापित करते हैं
विधि की प्रयोज्यता सीमा का विस्तार किया, विश्लेषणात्मक ज्ञान के बिना अज्ञात स्लाइसिंग फलनों के साथ कर्नल को संभालने के लिए

विधि विवरण

कार्य परिभाषा

एक रेडियल आधार फलन $F: [0,\infty) \to \mathbb{R}$ दिया गया है, एक फलन $f: [0,\infty) \to \mathbb{R}$ खोजें जो स्लाइसिंग संबंध $F = S_d[f]$ को संतुष्ट करता है, जहाँ $S_d$ एक सामान्यीकृत Riemann-Liouville भिन्नात्मक समाकलन संचालक है:

$S_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt$

जहाँ $\varrho_d(t) := c_d(1-t^2)^{(d-3)/2}$ , $c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)}$ ।

मॉडल आर्किटेक्चर

1. अनुकूलन समस्या निर्माण

स्लाइसिंग फलन पुनर्प्राप्ति को एक नियमितकृत न्यूनीकरण समस्या में परिवर्तित करें:

$\hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2$

जहाँ $f_a = C^{-1}[a]$ एक $K$ -पद कोसाइन श्रृंखला है:

$f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt)$

2. स्थान-डोमेन विधि (एल्गोरिदम 1)

मैट्रिक्स निर्माण: $h_k := S_d[g_k]$ की गणना करें, जहाँ $g_k$ कोसाइन आधार फलन हैं
विवेकीकरण: समाकलन को अनुमानित करने के लिए Gauss-Legendre चतुर्भुज विधि का उपयोग करें
समाधान: न्यूनतम वर्ग समस्या $\|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2$ को हल करें

3. आवृत्ति-डोमेन विधि (एल्गोरिदम 2)

संचालक प्रतिनिधित्व: संचालक $S := C \circ S_d \circ C^{-1}$ का मैट्रिक्स प्रतिनिधित्व बनाएं
गुणांक गणना: संबंध $S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k)$ का उपयोग करें
अनुकूलन समाधान: आवृत्ति-डोमेन स्थान में नियमितकृत समस्या को हल करें

तकनीकी नवाचार

सैद्धांतिक आधार: विभिन्न फलन स्थानों पर स्लाइसिंग संचालक $S_d$ की परिबद्धता सिद्धांत स्थापित किया
संख्यात्मक स्थिरता: Tikhonov नियमितकरण के माध्यम से बीमार-स्थिति समस्याओं को संभालें
त्रुटि विघटन: कुल त्रुटि को अग्रगामी त्रुटि और स्लाइसिंग त्रुटि में विभाजित करें
अभिसरण विश्लेषण: फलन सुगमता धारणा के तहत अभिसरण दर साबित करें

प्रयोग सेटअप

डेटासेट

विभिन्न रेडियल आधार फलनों का परीक्षण करने के लिए उपयोग किया गया:

गाउस: $F(s) = \exp(-s^2/(2c^2))$
लाप्लास: $F(s) = \exp(-c|s|)$
व्युत्क्रम बहुद्विघात (IMQ): $F(s) = (c^2 + s^2)^{-1/2}$
पतली प्लेट स्पलाइन (TPS): $F(s) = (cs)^2\log(|cs|)$
लॉग कर्नल (LOG): $F(s) = \log(|cs|)$
Bump फलन और बहुद्विघात (MQ)

मूल्यांकन मेट्रिक्स

अग्रगामी त्रुटि: $|F_K(s) - F(s)|$
सापेक्ष L2 त्रुटि: $\|s - \hat{s}\|_2/\|s\|_2$
रनटाइम तुलना

तुलनात्मक विधियाँ

प्रत्यक्ष विधि: जब विश्लेषणात्मक समाधान $f = S_d^{-1}[F]$ ज्ञात हो तो काटी गई फूरियर श्रृंखला
PyKeOps: अत्यधिक अनुकूलित GPU क्रूर गणना पैकेज
तीन कॉन्फ़िगरेशन: S-L2-H1, F-L2-H1, F-H1-H1

कार्यान्वयन विवरण

$L = 2^{10}$ चतुर्भुज बिंदुओं का उपयोग करें
डोमेन में $K = 2^8$ कोसाइन गुणांक, रेंज में $J = 2^{10}$
नियमितकरण पैरामीटर $\tau \in \{10^{-6}, 10^{-7}, 10^{-4}\}$

प्रयोग परिणाम

मुख्य परिणाम

अग्रगामी त्रुटि विश्लेषण

लाप्लास और Bump फलनों के लिए, अग्रगामी त्रुटि $|F_K(s) - F(s)|$ पूरे अंतराल $[0,1]$ पर $10^{-2}$ से कम है, फलन के अनियमित क्षेत्रों में (जैसे $s=0$ पर लाप्लास फलन) त्रुटि थोड़ी अधिक है।

तीव्र कर्नल योग सटीकता

$d=1000$ आयाम, $N=M=10^4$ नमूनों के परीक्षण में:

फलन	S-L2-H1	F-L2-H1	F-H1-H1	Direct
गाउस	6.53×10⁻³	6.62×10⁻³	6.61×10⁻³	6.56×10⁻³
लाप्लास	8.58×10⁻³	8.32×10⁻³	1.30×10⁻²	5.90×10⁻³
IMQ	2.25×10⁻³	2.27×10⁻³	2.28×10⁻³	2.26×10⁻³
LOG	1.00×10⁻¹	1.80×10⁻¹	1.55×10⁻¹	2.98×10¹

रनटाइम तुलना

कम्प्यूटेशनल ओवरहेड: गुणांक गणना समय लगभग 0.1 सेकंड (GPU) से 1.3 सेकंड (CPU)
त्वरण प्रभाव: जब $N \geq 3 \times 10^3$ हो तो तीव्र योग विधि क्रूर विधि से आगे निकल जाती है
उल्लेखनीय त्वरण: $N = 5 \times 10^4$ नमूनों के लिए, लगभग 50 गुना त्वरण प्राप्त करें

विलोपन प्रयोग

नियमितकरण पैरामीटर $\tau$ का चयन महत्वपूर्ण है:

बहुत छोटा $\tau$ संख्यात्मक अस्थिरता का कारण बनता है
बहुत बड़ा $\tau$ अत्यधिक नियमितकरण का कारण बनता है
इष्टतम मान आमतौर पर $10^{-6}$ से $10^{-4}$ सीमा में होता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

सैद्धांतिक योगदान: संपूर्ण स्लाइसिंग संचालक सिद्धांत स्थापित किया, जिसमें संचालक मानदंड अनुमान और त्रुटि सीमाएं शामिल हैं
संख्यात्मक विधियाँ: प्रस्तावित दोनों एल्गोरिदम अज्ञात स्लाइसिंग फलनों के गुणांकों को प्रभावी ढंग से पुनः प्राप्त कर सकते हैं
व्यावहारिक मूल्य: विधि उच्च-आयामी स्थिति में क्रूर गणना से काफी बेहतर है, बड़े पैमाने पर अनुप्रयोगों के लिए उपयुक्त है

सीमाएँ

आयाम निर्भरता: जटिलता में सुधार के बावजूद, अभी भी $O(dP)$ गणना की आवश्यकता है
नियमितकरण संवेदनशीलता: नियमितकरण पैरामीटर को सावधानीपूर्वक समायोजित करने की आवश्यकता है
सुगमता आवश्यकता: अभिसरण विश्लेषण फलन की सुगमता धारणा पर निर्भर करता है

भविष्य की दिशाएँ

स्वचालित पैरामीटर चयन: नियमितकरण पैरामीटर को स्वचालित रूप से चुनने की विधियाँ विकसित करें
अधिक कुशल चतुर्भुज: सटीकता में सुधार के लिए विशेष चतुर्भुज नियमों की खोज करें
अनुप्रयोग विस्तार: विशिष्ट मशीन लर्निंग कार्यों में विधि की व्यावहारिकता को सत्यापित करें

गहन मूल्यांकन

शक्तियाँ

सैद्धांतिक कठोरता: संपूर्ण कार्यात्मक विश्लेषण सैद्धांतिक ढांचा प्रदान करता है, जिसमें संचालक परिबद्धता और अभिसरण विश्लेषण शामिल है
विधि व्यावहारिकता: दोनों एल्गोरिदम के अपने लाभ हैं, स्थान-डोमेन विधि सहज है, आवृत्ति-डोमेन विधि सैद्धांतिक रूप से सुरुचिपूर्ण है
व्यापक प्रयोग: विभिन्न कर्नल फलनों का परीक्षण किया, चिकने से गैर-चिकने तक, विधि की मजबूती को सत्यापित किया
उत्कृष्ट प्रदर्शन: सटीकता बनाए रखते हुए उल्लेखनीय कम्प्यूटेशनल त्वरण प्राप्त किया

कमियाँ

पैरामीटर समायोजन: नियमितकरण पैरामीटर का चयन अनुभव की आवश्यकता है, स्वचालित विधि की कमी है
मेमोरी आवश्यकता: मैट्रिक्स भंडारण अत्यधिक उच्च-आयामी स्थिति में बाधा बन सकता है
विशेष मामलों का उपचार: कुछ बीमार-स्थिति कर्नल फलनों (जैसे LOG) के लिए, विधि प्रदर्शन सीमित है

प्रभाव

शैक्षणिक मूल्य: उच्च-आयामी कर्नल विधियों के लिए नए सैद्धांतिक उपकरण और संख्यात्मक तकनीकें प्रदान करता है
व्यावहारिक महत्व: मशीन लर्निंग के बड़े पैमाने पर अनुप्रयोगों में महत्वपूर्ण मूल्य है
पुनरुत्पादनीयता: खुला स्रोत कोड प्रदान करता है, शोधकर्ताओं को उपयोग और विस्तार में सुविधा देता है

प्रयोज्य परिदृश्य

बड़े पैमाने पर मशीन लर्निंग: विशेष रूप से उच्च नमूना मात्रा और उच्च आयाम वाली कर्नल विधि अनुप्रयोगों के लिए उपयुक्त
वैज्ञानिक कम्प्यूटिंग: तीव्र कर्नल योग की आवश्यकता वाले संख्यात्मक सिमुलेशन में व्यापक अनुप्रयोग संभावना
वास्तविक समय प्रणालियाँ: गुणांकों की पूर्व-गणना के बाद तीव्र ऑनलाइन अनुमान प्राप्त कर सकते हैं

संदर्भ

पेपर 52 संबंधित संदर्भों का हवाला देता है, जिसमें कर्नल विधियाँ, तीव्र एल्गोरिदम, सामंजस्यपूर्ण विश्लेषण आदि कई क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।