Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
लेखक: Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL and Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)
कर्नल फलन मशीन लर्निंग में अंतःक्रिया संबंधों को मॉडल करने के लिए महत्वपूर्ण हैं। हालांकि, संबंधित कर्नल फलन योग की क्रूर गणना की जटिलता नमूना संख्या के साथ द्विघात रूप से बढ़ती है। हाल की फूरियर स्लाइसिंग विधि जटिलता को रैखिक तक कम कर सकती है, बशर्ते कर्नल फलन को स्लाइस किया जा सके और इसके फूरियर गुणांक ज्ञात हों। इन गुणांकों को प्राप्त करने के लिए, यह पेपर स्लाइसिंग संबंध को एक व्युत्क्रम समस्या के रूप में मानता है और दो पुनर्प्राप्ति एल्गोरिदम प्रस्तावित करता है। व्यापक संख्यात्मक प्रयोग विधि की गति और सटीकता को प्रदर्शित करते हैं।
कर्नल विधियाँ मशीन लर्निंग में घनत्व अनुमान, समर्थन सदिश मशीन वर्गीकरण, प्रमुख घटक विश्लेषण, अधिकतम माध्य विसंगति (MMD) आदि कार्यों में व्यापक रूप से लागू होती हैं। इन अनुप्रयोगों की कम्प्यूटेशनल बाधा आमतौर पर निम्नलिखित रूप की अभिव्यक्ति का मूल्यांकन है:
sm:=∑n=1NF(∥xn−ym∥)wn,m=1,…,M
जहाँ F∈C([0,∞)) एक रेडियल आधार फलन है, x1,…,xN,y1,…,yM∈Rd नमूना बिंदु हैं, और w∈RN भार हैं।
प्रत्यक्ष गणना के लिए O(NMd) संचालन की आवश्यकता होती है, जो बड़े डेटासेट के लिए अव्यावहारिक है। तीव्र फूरियर योग और तीव्र बहुध्रुव विधि जैसी शास्त्रीय विधियाँ जटिलता को O(M+N) तक कम कर सकती हैं, लेकिन तीव्र फूरियर रूपांतरण या स्थानिक विभाजन पर निर्भरता के कारण, जब d>4 हो तो घातीय निर्भरता दिखाई देती है, जिससे वे अव्यावहारिक हो जाते हैं।
स्लाइसिंग एल्गोरिदम का मूल विचार एक फलन f∈Lloc1([0,∞)) खोजना है जो निम्नलिखित को संतुष्ट करता है:
F(∥x∥)=ωd−11∫Sd−1f(∣⟨ξ,x⟩∣)dξ
जहाँ ωd−1=2πd/2/Γ(d/2)d-आयामी गोले का सतह माप है। समाकलन को विवेकित करके, कर्नल योग को एक-आयामी स्थिति में सरल किया जा सकता है, तीव्र फूरियर योग का उपयोग करके कुशलतापूर्वक गणना की जा सकती है।
एक रेडियल आधार फलन F:[0,∞)→R दिया गया है, एक फलन f:[0,∞)→R खोजें जो स्लाइसिंग संबंध F=Sd[f] को संतुष्ट करता है, जहाँ Sd एक सामान्यीकृत Riemann-Liouville भिन्नात्मक समाकलन संचालक है:
Sd[f](s)=∫01f(ts)ϱd(t)dt
जहाँ ϱd(t):=cd(1−t2)(d−3)/2, cd:=πΓ((d−1)/2)2Γ(d/2)।
लाप्लास और Bump फलनों के लिए, अग्रगामी त्रुटि ∣FK(s)−F(s)∣ पूरे अंतराल [0,1] पर 10−2 से कम है, फलन के अनियमित क्षेत्रों में (जैसे s=0 पर लाप्लास फलन) त्रुटि थोड़ी अधिक है।
पेपर 52 संबंधित संदर्भों का हवाला देता है, जिसमें कर्नल विधियाँ, तीव्र एल्गोरिदम, सामंजस्यपूर्ण विश्लेषण आदि कई क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।