Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
লেখক: Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL এবং Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)
কার্নেল ফাংশন মেশিন লার্নিংয়ে মিথস্ক্রিয়া সম্পর্ক মডেলিংয়ের জন্য অত্যন্ত গুরুত্বপূর্ণ। তবে, সম্পর্কিত কার্নেল ফাংশন সমষ্টির বর্বর গণনার জটিলতা নমুনা সংখ্যার সাথে দ্বিঘাত হারে বৃদ্ধি পায়। সাম্প্রতিক ফুরিয়ার স্লাইসিং পদ্ধতি জটিলতা রৈখিক পর্যন্ত হ্রাস করতে পারে, শর্ত সাপেক্ষে যে কার্নেল ফাংশন স্লাইস করা যায় এবং এর ফুরিয়ার সহগ পরিচিত। এই সহগ পেতে, এই পেপারটি স্লাইসিং সম্পর্ককে একটি বিপরীত সমস্যা হিসাবে বিবেচনা করে এবং দুটি পুনরুদ্ধার অ্যালগরিদম প্রস্তাব করে। ব্যাপক সংখ্যাসূচক পরীক্ষা পদ্ধতির গতি এবং নির্ভুলতা প্রমাণ করে।
কার্নেল পদ্ধতি মেশিন লার্নিংয়ে ঘনত্ব অনুমান, সাপোর্ট ভেক্টর মেশিন শ্রেণীবিভাগ, প্রধান উপাদান বিশ্লেষণ, সর্বাধিক গড় বৈষম্য (MMD) এবং অন্যান্য কাজে ব্যাপকভাবে প্রয়োগ করা হয়। এই অ্যাপ্লিকেশনগুলির গণনামূলক বাধা সাধারণত নিম্নলিখিত ফর্মের অভিব্যক্তি মূল্যায়ন করা:
sm:=∑n=1NF(∥xn−ym∥)wn,m=1,…,M
যেখানে F∈C([0,∞)) একটি রেডিয়াল ভিত্তি ফাংশন, x1,…,xN,y1,…,yM∈Rd নমুনা পয়েন্ট, এবং w∈RN ওজন।
সরাসরি গণনার জন্য O(NMd) অপারেশন প্রয়োজন, যা বড় ডেটাসেটের জন্য অসম্ভব। দ্রুত ফুরিয়ার সমষ্টি এবং দ্রুত মাল্টিপোল পদ্ধতির মতো ক্লাসিক্যাল পদ্ধতি যদিও জটিলতা O(M+N) এ হ্রাস করতে পারে, তবে দ্রুত ফুরিয়ার রূপান্তর বা স্থানিক বিভাজনের উপর নির্ভরতার কারণে, d>4 মাত্রায় সূচকীয় নির্ভরতা প্রদর্শন করে, যা এটিকে অসম্ভব করে তোলে।
স্লাইসিং অ্যালগরিদমের মূল ধারণা হল একটি ফাংশন f∈Lloc1([0,∞)) খুঁজে পাওয়া যেমন:
F(∥x∥)=ωd−11∫Sd−1f(∣⟨ξ,x⟩∣)dξ
যেখানে ωd−1=2πd/2/Γ(d/2) হল d-মাত্রিক গোলকের পৃষ্ঠ পরিমাপ। সমাকলন বিচ্ছিন্ন করার মাধ্যমে, কার্নেল সমষ্টি একটি এক-মাত্রিক ক্ষেত্রে সরলীকৃত হতে পারে, দ্রুত ফুরিয়ার সমষ্টি ব্যবহার করে দক্ষতার সাথে গণনা করা যায়।
একটি রেডিয়াল ভিত্তি ফাংশন F:[0,∞)→R দেওয়া, একটি ফাংশন f:[0,∞)→R খুঁজে পান যেমন স্লাইসিং সম্পর্ক F=Sd[f] ধারণ করে, যেখানে Sd একটি সাধারণীকৃত Riemann-Liouville ভগ্নাংশ সমাকল অপারেটর:
Sd[f](s)=∫01f(ts)ϱd(t)dt
যেখানে ϱd(t):=cd(1−t2)(d−3)/2, cd:=πΓ((d−1)/2)2Γ(d/2)।
ল্যাপ্লেস এবং বাম্প ফাংশনের জন্য, সামনের দিকের ত্রুটি ∣FK(s)−F(s)∣ সম্পূর্ণ ব্যবধান [0,1] জুড়ে 10−2 এর চেয়ে কম, ফাংশন অনিয়মিত অঞ্চলে (যেমন s=0 এ ল্যাপ্লেস ফাংশন) ত্রুটি সামান্য বড়।
পেপারটি 52টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা কার্নেল পদ্ধতি, দ্রুত অ্যালগরিদম, সুরেলা বিশ্লেষণ এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।