Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
تعتبر دوال النواة حاسمة في التعلم الآلي لنمذجة العلاقات التفاعلية. ومع ذلك، فإن الحساب المباشر لمجاميع النواة ذات الصلة يتمتع بتعقيد حسابي ينمو بشكل تربيعي مع عدد العينات. يمكن لطرق تقطيع فورييه الحديثة تقليل التعقيد إلى خطي، بشرط أن تكون دالة النواة قابلة للتقطيع وأن تكون معاملات فورييه معروفة. للحصول على هذه المعاملات، تعامل هذه الورقة مع علاقة التقطيع كمشكلة عكسية وتقترح خوارزميتي استرجاع. تثبت التجارب العددية الواسعة السرعة والدقة المتفوقة للطريقة.
تُستخدم طرق النواة على نطاق واسع في التعلم الآلي لتقدير الكثافة وتصنيف آلات المتجهات الداعمة وتحليل المكونات الرئيسية والفرق المتوسط الأقصى (MMD) وغيرها من المهام. عادة ما يكون الاختناق الحسابي لهذه التطبيقات هو تقييم التعبيرات بالشكل التالي:
sm:=∑n=1NF(∥xn−ym∥)wn,m=1,…,M
حيث F∈C([0,∞)) هي دالة أساس شعاعية، و x1,…,xN,y1,…,yM∈Rd هي نقاط العينات، و w∈RN هي الأوزان.
يتطلب الحساب المباشر O(NMd) عملية، وهو غير عملي لمجموعات البيانات الكبيرة. الطرق الكلاسيكية مثل جمع فورييه السريع والطريقة متعددة الأقطاب السريعة، على الرغم من أنها تقلل التعقيد إلى O(M+N)، إلا أنها تعاني من اعتماد أسي على البعد d>4 بسبب اعتمادها على تحويل فورييه السريع أو تقسيم المساحة، مما يجعلها غير عملية.
الفكرة الأساسية لخوارزمية التقطيع هي البحث عن دالة f∈Lloc1([0,∞)) بحيث:
F(∥x∥)=ωd−11∫Sd−1f(∣⟨ξ,x⟩∣)dξ
حيث ωd−1=2πd/2/Γ(d/2) هي مقياس السطح للكرة d-البعدية. من خلال تقطيع التكامل، يمكن تبسيط جمع النواة إلى الحالة أحادية البعد، مما يسمح بالحساب الفعال باستخدام جمع فورييه السريع.
بالنظر إلى دالة أساس شعاعية F:[0,∞)→R، ابحث عن دالة f:[0,∞)→R بحيث تكون علاقة التقطيع F=Sd[f] صحيحة، حيث Sd هي عامل التكامل الكسري المعمم من نوع Riemann-Liouville:
Sd[f](s)=∫01f(ts)ϱd(t)dt
حيث ϱd(t):=cd(1−t2)(d−3)/2، و cd:=πΓ((d−1)/2)2Γ(d/2).
بالنسبة لدوال Laplace و Bump، الخطأ الأمامي ∣FK(s)−F(s)∣ أقل من 10−2 على كامل الفترة [0,1]، مع خطأ أكبر قليلاً في المناطق غير المنتظمة للدالة (مثل دالة Laplace عند s=0).
تستشهد الورقة بـ 52 مرجعاً ذا صلة، تغطي أعمالاً مهمة في مجالات طرق النواة والخوارزميات السريعة والتحليل التوافقي وغيرها، مما يوفر أساساً نظرياً متيناً للبحث.