2025-11-15T09:01:12.242557

Numerical Methods for Kernel Slicing

Rux, Hertrich, Neumayer
Kernels are key in machine learning for modeling interactions. Unfortunately, brute-force computation of the related kernel sums scales quadratically with the number of samples. Recent Fourier-slicing methods lead to an improved linear complexity, provided that the kernel can be sliced and its Fourier coefficients are known. To obtain these coefficients, we view the slicing relation as an inverse problem and present two algorithms for their recovery. Extensive numerical experiments demonstrate the speed and accuracy of our methods.
academic

কার্নেল স্লাইসিংয়ের জন্য সংখ্যাসূচক পদ্ধতি

মৌলিক তথ্য

  • পেপার আইডি: 2510.11478
  • শিরোনাম: Numerical Methods for Kernel Slicing
  • লেখক: Nicolaj Rux (Chemnitz University of Technology), Johannes Hertrich (Université Paris Dauphine-PSL এবং Inria Mokaplan), Sebastian Neumayer (Chemnitz University of Technology)
  • শ্রেণীবিভাগ: math.NA, cs.NA
  • প্রকাশনার সময়: অক্টোবর ১৪, ২০২৫
  • পেপার লিঙ্ক: https://arxiv.org/abs/2510.11478v1

সারসংক্ষেপ

কার্নেল ফাংশন মেশিন লার্নিংয়ে মিথস্ক্রিয়া সম্পর্ক মডেলিংয়ের জন্য অত্যন্ত গুরুত্বপূর্ণ। তবে, সম্পর্কিত কার্নেল ফাংশন সমষ্টির বর্বর গণনার জটিলতা নমুনা সংখ্যার সাথে দ্বিঘাত হারে বৃদ্ধি পায়। সাম্প্রতিক ফুরিয়ার স্লাইসিং পদ্ধতি জটিলতা রৈখিক পর্যন্ত হ্রাস করতে পারে, শর্ত সাপেক্ষে যে কার্নেল ফাংশন স্লাইস করা যায় এবং এর ফুরিয়ার সহগ পরিচিত। এই সহগ পেতে, এই পেপারটি স্লাইসিং সম্পর্ককে একটি বিপরীত সমস্যা হিসাবে বিবেচনা করে এবং দুটি পুনরুদ্ধার অ্যালগরিদম প্রস্তাব করে। ব্যাপক সংখ্যাসূচক পরীক্ষা পদ্ধতির গতি এবং নির্ভুলতা প্রমাণ করে।

গবেষণা পটভূমি এবং প্রেরণা

মূল সমস্যা

কার্নেল পদ্ধতি মেশিন লার্নিংয়ে ঘনত্ব অনুমান, সাপোর্ট ভেক্টর মেশিন শ্রেণীবিভাগ, প্রধান উপাদান বিশ্লেষণ, সর্বাধিক গড় বৈষম্য (MMD) এবং অন্যান্য কাজে ব্যাপকভাবে প্রয়োগ করা হয়। এই অ্যাপ্লিকেশনগুলির গণনামূলক বাধা সাধারণত নিম্নলিখিত ফর্মের অভিব্যক্তি মূল্যায়ন করা:

sm:=n=1NF(xnym)wn,m=1,,Ms_m := \sum_{n=1}^N F(\|x_n - y_m\|)w_n, \quad m = 1,\ldots,M

যেখানে FC([0,))F \in C([0,\infty)) একটি রেডিয়াল ভিত্তি ফাংশন, x1,,xN,y1,,yMRdx_1,\ldots,x_N, y_1,\ldots,y_M \in \mathbb{R}^d নমুনা পয়েন্ট, এবং wRNw \in \mathbb{R}^N ওজন।

গণনামূলক জটিলতার চ্যালেঞ্জ

সরাসরি গণনার জন্য O(NMd)O(NMd) অপারেশন প্রয়োজন, যা বড় ডেটাসেটের জন্য অসম্ভব। দ্রুত ফুরিয়ার সমষ্টি এবং দ্রুত মাল্টিপোল পদ্ধতির মতো ক্লাসিক্যাল পদ্ধতি যদিও জটিলতা O(M+N)O(M+N) এ হ্রাস করতে পারে, তবে দ্রুত ফুরিয়ার রূপান্তর বা স্থানিক বিভাজনের উপর নির্ভরতার কারণে, d>4d > 4 মাত্রায় সূচকীয় নির্ভরতা প্রদর্শন করে, যা এটিকে অসম্ভব করে তোলে।

স্লাইসিং অ্যালগরিদমের সুবিধা

স্লাইসিং অ্যালগরিদমের মূল ধারণা হল একটি ফাংশন fLloc1([0,))f \in L^1_{loc}([0,\infty)) খুঁজে পাওয়া যেমন:

F(x)=1ωd1Sd1f(ξ,x)dξF(\|x\|) = \frac{1}{\omega_{d-1}} \int_{S^{d-1}} f(|\langle\xi, x\rangle|)d\xi

যেখানে ωd1=2πd/2/Γ(d/2)\omega_{d-1} = 2\pi^{d/2}/\Gamma(d/2) হল dd-মাত্রিক গোলকের পৃষ্ঠ পরিমাপ। সমাকলন বিচ্ছিন্ন করার মাধ্যমে, কার্নেল সমষ্টি একটি এক-মাত্রিক ক্ষেত্রে সরলীকৃত হতে পারে, দ্রুত ফুরিয়ার সমষ্টি ব্যবহার করে দক্ষতার সাথে গণনা করা যায়।

মূল অবদান

  1. স্লাইসিং ফাংশন পুনরুদ্ধার সমস্যাকে একটি বিপরীত সমস্যা হিসাবে আনুষ্ঠানিকীকরণ, সম্পূর্ণ তাত্ত্বিক কাঠামো প্রতিষ্ঠা করা
  2. দুটি সংখ্যাসূচক অ্যালগরিদম প্রস্তাব দ্রুত ফুরিয়ার সমষ্টির জন্য প্রয়োজনীয় কোসাইন সিরিজ সহগ পুনরুদ্ধার করতে
  3. কঠোর ত্রুটি অনুমান প্রদান, সামনের দিকের ত্রুটি এবং স্লাইসিং ত্রুটির বিশ্লেষণ সহ
  4. ব্যাপক সংখ্যাসূচক পরীক্ষা বিভিন্ন কার্নেল ফাংশনে পদ্ধতির দক্ষতা এবং নির্ভুলতা যাচাই করা
  5. পদ্ধতির প্রযোজ্য পরিসীমা সম্প্রসারণ, বিশ্লেষণাত্মক জ্ঞান ছাড়াই অজানা স্লাইসিং ফাংশন সহ কার্নেল পরিচালনা করা

পদ্ধতির বিস্তারিত বর্ণনা

কাজের সংজ্ঞা

একটি রেডিয়াল ভিত্তি ফাংশন F:[0,)RF: [0,\infty) \to \mathbb{R} দেওয়া, একটি ফাংশন f:[0,)Rf: [0,\infty) \to \mathbb{R} খুঁজে পান যেমন স্লাইসিং সম্পর্ক F=Sd[f]F = S_d[f] ধারণ করে, যেখানে SdS_d একটি সাধারণীকৃত Riemann-Liouville ভগ্নাংশ সমাকল অপারেটর:

Sd[f](s)=01f(ts)ϱd(t)dtS_d[f](s) = \int_0^1 f(ts)\varrho_d(t)dt

যেখানে ϱd(t):=cd(1t2)(d3)/2\varrho_d(t) := c_d(1-t^2)^{(d-3)/2}, cd:=2Γ(d/2)πΓ((d1)/2)c_d := \frac{2\Gamma(d/2)}{\sqrt{\pi}\Gamma((d-1)/2)}

মডেল আর্কিটেকচার

১. অপ্টিমাইজেশন সমস্যা নির্মাণ

স্লাইসিং ফাংশন পুনরুদ্ধারকে একটি নিয়মিতকৃত ন্যূনতমকরণ সমস্যায় রূপান্তরিত করা:

a^=argminaRKSd[fa]FH2+τ2faG2\hat{a} = \arg\min_{a \in \mathbb{R}^K} \|S_d[f_a] - F\|_H^2 + \tau^2\|f_a\|_G^2

যেখানে fa=C1[a]f_a = C^{-1}[a] হল KK-পদ কোসাইন সিরিজ:

fa(t)=a0+2k=1K1akcos(πkt)f_a(t) = a_0 + \sqrt{2}\sum_{k=1}^{K-1} a_k \cos(\pi kt)

২. স্থান ডোমেইন পদ্ধতি (অ্যালগরিদম ১)

  • ম্যাট্রিক্স নির্মাণ: hk:=Sd[gk]h_k := S_d[g_k] গণনা করুন, যেখানে gkg_k কোসাইন ভিত্তি ফাংশন
  • বিচ্ছিন্নকরণ: সমাকল আনুমানিক করতে Gauss-Legendre চতুর্ভুজ পদ্ধতি ব্যবহার করুন
  • সমাধান: ন্যূনতম বর্গ সমস্যা সমাধান করুন H^Tab^22+τ2Da22\|\hat{H}^T a - \hat{b}\|_2^2 + \tau^2\|Da\|_2^2

३. ফ্রিকোয়েন্সি ডোমেইন পদ্ধতি (অ্যালগরিদম २)

  • অপারেটর প্রতিনিধিত্ব: অপারেটর S:=CSdC1S := C \circ S_d \circ C^{-1} এর ম্যাট্রিক্স প্রতিনিধিত্ব নির্মাণ করুন
  • সহগ গণনা: সম্পর্ক Sj,k=Sd[sinc(+j)+sinc(j)](k)S_{j,k} = S_d[\text{sinc}(\cdot + j) + \text{sinc}(\cdot - j)](k) ব্যবহার করুন
  • অপ্টিমাইজেশন সমাধান: ফ্রিকোয়েন্সি ডোমেইন স্থানে নিয়মিতকৃত সমস্যা সমাধান করুন

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. তাত্ত্বিক ভিত্তি: বিভিন্ন ফাংশন স্থানে স্লাইসিং অপারেটর SdS_d এর সীমাবদ্ধতা তত্ত্ব প্রতিষ্ঠা করা
  2. সংখ্যাসূচক স্থিতিশীলতা: Tikhonov নিয়মিতকরণের মাধ্যমে অসুস্থ-অবস্থিত সমস্যা পরিচালনা করা
  3. ত্রুটি বিয়োজন: মোট ত্রুটিকে সামনের দিকের ত্রুটি এবং স্লাইসিং ত্রুটিতে বিয়োজন করা
  4. সংগ্রহ বিশ্লেষণ: ফাংশন মসৃণতা অনুমানের অধীনে সংগ্রহ হার প্রমাণ করা

পরীক্ষা সেটআপ

ডেটাসেট

পরীক্ষার জন্য বিভিন্ন রেডিয়াল ভিত্তি ফাংশন ব্যবহার করা হয়:

  • গাউস: F(s)=exp(s2/(2c2))F(s) = \exp(-s^2/(2c^2))
  • ল্যাপ্লেস: F(s)=exp(cs)F(s) = \exp(-c|s|)
  • বিপরীত মাল্টিকোয়াড্রিক (IMQ): F(s)=(c2+s2)1/2F(s) = (c^2 + s^2)^{-1/2}
  • পাতলা প্লেট স্প্লাইন (TPS): F(s)=(cs)2log(cs)F(s) = (cs)^2\log(|cs|)
  • লগারিদম কার্নেল (LOG): F(s)=log(cs)F(s) = \log(|cs|)
  • বাম্প ফাংশন এবং মাল্টিকোয়াড্রিক (MQ)

মূল্যায়ন মেট্রিক্স

  • সামনের দিকের ত্রুটি: FK(s)F(s)|F_K(s) - F(s)|
  • আপেক্ষিক L2 ত্রুটি: ss^2/s2\|s - \hat{s}\|_2/\|s\|_2
  • চলমান সময় তুলনা

তুলনামূলক পদ্ধতি

  • সরাসরি পদ্ধতি: যখন বিশ্লেষণাত্মক সমাধান f=Sd1[F]f = S_d^{-1}[F] পরিচিত হয় তখন ছাঁটা ফুরিয়ার সিরিজ
  • PyKeOps: অত্যন্ত অপ্টিমাইজড GPU বর্বর গণনা প্যাকেজ
  • তিনটি কনফিগারেশন: S-L2-H1, F-L2-H1, F-H1-H1

বাস্তবায়ন বিবরণ

  • L=210L = 2^{10} চতুর্ভুজ পয়েন্ট ব্যবহার করুন
  • ডোমেইনে K=28K = 2^8 কোসাইন সহগ, মূল্য পরিসরে J=210J = 2^{10}
  • নিয়মিতকরণ প্যারামিটার τ{106,107,104}\tau \in \{10^{-6}, 10^{-7}, 10^{-4}\}

পরীক্ষার ফলাফল

প্রধান ফলাফল

সামনের দিকের ত্রুটি বিশ্লেষণ

ল্যাপ্লেস এবং বাম্প ফাংশনের জন্য, সামনের দিকের ত্রুটি FK(s)F(s)|F_K(s) - F(s)| সম্পূর্ণ ব্যবধান [0,1][0,1] জুড়ে 10210^{-2} এর চেয়ে কম, ফাংশন অনিয়মিত অঞ্চলে (যেমন s=0s=0 এ ল্যাপ্লেস ফাংশন) ত্রুটি সামান্য বড়।

দ্রুত কার্নেল সমষ্টি নির্ভুলতা

d=1000d=1000 মাত্রায়, N=M=104N=M=10^4 নমুনার পরীক্ষায়:

ফাংশনS-L2-H1F-L2-H1F-H1-H1Direct
গাউস6.53×10⁻³6.62×10⁻³6.61×10⁻³6.56×10⁻³
ল্যাপ্লেস8.58×10⁻³8.32×10⁻³1.30×10⁻²5.90×10⁻³
IMQ2.25×10⁻³2.27×10⁻³2.28×10⁻³2.26×10⁻³
LOG1.00×10⁻¹1.80×10⁻¹1.55×10⁻¹2.98×10¹

চলমান সময় তুলনা

  • গণনামূলক খরচ: সহগ গণনা সময় প্রায় 0.1 সেকেন্ড (GPU) থেকে 1.3 সেকেন্ড (CPU)
  • ত্বরণ প্রভাব: যখন N3×103N \geq 3 \times 10^3 হয়, দ্রুত সমষ্টি পদ্ধতি বর্বর পদ্ধতি অতিক্রম করতে শুরু করে
  • উল্লেখযোগ্য ত্বরণ: N=5×104N = 5 \times 10^4 নমুনার জন্য, প্রায় 50 গুণ ত্বরণ অর্জন করা হয়

বিলোপন পরীক্ষা

নিয়মিতকরণ প্যারামিটার τ\tau এর নির্বাচন অত্যন্ত গুরুত্বপূর্ণ:

  • খুব ছোট τ\tau সংখ্যাসূচক অস্থিরতার দিকে পরিচালিত করে
  • খুব বড় τ\tau অত্যধিক নিয়মিতকরণের দিকে পরিচালিত করে
  • সর্বোত্তম মান সাধারণত 10610^{-6} থেকে 10410^{-4} পরিসরে থাকে

সম্পর্কিত কাজ

স্লাইসিং পদ্ধতির উন্নয়ন

  • প্রাথমিকভাবে Wasserstein দূরত্বের র্যান্ডম এক-মাত্রিক প্রজেকশনে প্রদর্শিত হয়
  • MMD এবং অন্যান্য কার্নেল মেট্রিক্সে সম্প্রসারিত
  • র্যান্ডম ফুরিয়ার বৈশিষ্ট্যের সাথে ঘনিষ্ঠভাবে সম্পর্কিত কিন্তু আরও সাধারণ

দ্রুত কার্নেল সমষ্টি পদ্ধতি

  • ঐতিহ্যবাহী পদ্ধতি: অ-সমান ব্যবধান দ্রুত ফুরিয়ার রূপান্তর, দ্রুত মাল্টিপোল পদ্ধতি
  • উচ্চ-মাত্রিক চ্যালেঞ্জ: মাত্রা দুর্যোগ ঐতিহ্যবাহী পদ্ধতির প্রযোজ্যতা সীমিত করে
  • GPU বাস্তবায়ন: KeOps ইত্যাদি মধ্যম মাত্রায় এখনও প্রতিযোগিতামূলক

তাত্ত্বিক ভিত্তি

স্লাইসিং সম্পর্ক সুরেলা বিশ্লেষণ এবং ভগ্নাংশ ক্যালকুলাসে একাধিক নাম রয়েছে:

  • সহযোগী Radon রূপান্তর
  • সাধারণীকৃত Riemann-Liouville ভগ্নাংশ সমাকল
  • Erdelyi-Kober সমাকলের বিশেষ ক্ষেত্র

উপসংহার এবং আলোচনা

প্রধান উপসংহার

  1. তাত্ত্বিক অবদান: সম্পূর্ণ স্লাইসিং অপারেটর তত্ত্ব প্রতিষ্ঠা করা, অপারেটর নর্ম অনুমান এবং ত্রুটি সীমা সহ
  2. সংখ্যাসূচক পদ্ধতি: প্রস্তাবিত দুটি অ্যালগরিদম অজানা স্লাইসিং ফাংশনের সহগ কার্যকরভাবে পুনরুদ্ধার করতে পারে
  3. ব্যবহারিক মূল্য: পদ্ধতি উচ্চ-মাত্রিক ক্ষেত্রে বর্বর গণনার চেয়ে উল্লেখযোগ্যভাবে উন্নত, বড় আকারের অ্যাপ্লিকেশনের জন্য উপযুক্ত

সীমাবদ্ধতা

  1. মাত্রা নির্ভরতা: যদিও জটিলতা উন্নত করা হয়েছে, তবুও O(dP)O(dP) গণনা প্রয়োজন
  2. নিয়মিতকরণ সংবেদনশীলতা: নিয়মিতকরণ প্যারামিটার সাবধানে সামঞ্জস্য করা প্রয়োজন
  3. মসৃণতা প্রয়োজনীয়তা: সংগ্রহ বিশ্লেষণ ফাংশনের মসৃণতা অনুমানের উপর নির্ভর করে

ভবিষ্যত দিকনির্দেশনা

  1. স্ব-অভিযোজিত প্যারামিটার নির্বাচন: নিয়মিতকরণ প্যারামিটার স্বয়ংক্রিয়ভাবে নির্বাচন করার পদ্ধতি বিকাশ করা
  2. আরও দক্ষ চতুর্ভুজ: নির্ভুলতা উন্নত করতে বিশেষায়িত চতুর্ভুজ নিয়ম অন্বেষণ করা
  3. অ্যাপ্লিকেশন সম্প্রসারণ: নির্দিষ্ট মেশিন লার্নিং কাজে পদ্ধতির ব্যবহারিকতা যাচাই করা

গভীর মূল্যায়ন

সুবিধা

  1. তাত্ত্বিক কঠোরতা: সম্পূর্ণ ফাংশন বিশ্লেষণ তাত্ত্বিক কাঠামো প্রদান করে, অপারেটর সীমাবদ্ধতা এবং সংগ্রহ বিশ্লেষণ সহ
  2. পদ্ধতি ব্যবহারিকতা: দুটি অ্যালগরিদম প্রতিটি সুবিধা রয়েছে, স্থান ডোমেইন পদ্ধতি স্বজ্ঞাত, ফ্রিকোয়েন্সি ডোমেইন পদ্ধতি তাত্ত্বিকভাবে মার্জিত
  3. ব্যাপক পরীক্ষা: একাধিক কার্নেল ফাংশন পরীক্ষা করা হয়েছে, মসৃণ থেকে অ-মসৃণ, পদ্ধতির শক্তিশালীতা যাচাই করা
  4. চমৎকার কর্মক্ষমতা: নির্ভুলতা বজায় রেখে উল্লেখযোগ্য গণনামূলক ত্বরণ অর্জন করা

অপূর্ণতা

  1. প্যারামিটার সমন্বয়: নিয়মিতকরণ প্যারামিটারের নির্বাচন অভিজ্ঞতা প্রয়োজন, স্বয়ংক্রিয় পদ্ধতির অভাব
  2. মেমরি প্রয়োজনীয়তা: ম্যাট্রিক্স সংরক্ষণ অত্যন্ত উচ্চ-মাত্রিক ক্ষেত্রে একটি বাধা হতে পারে
  3. বিশেষ ক্ষেত্রে পরিচালনা: কিছু অসুস্থ-অবস্থিত কার্নেল ফাংশনের জন্য (যেমন LOG), পদ্ধতির কর্মক্ষমতা সীমিত

প্রভাব

  1. একাডেমিক মূল্য: উচ্চ-মাত্রিক কার্নেল পদ্ধতির জন্য নতুন তাত্ত্বিক সরঞ্জাম এবং সংখ্যাসূচক কৌশল প্রদান করা
  2. ব্যবহারিক তাৎপর্য: মেশিন লার্নিংয়ের বড় আকারের অ্যাপ্লিকেশনে গুরুত্বপূর্ণ মূল্য
  3. পুনরুৎপাদনযোগ্যতা: ওপেন সোর্স কোড প্রদান করা, গবেষকদের ব্যবহার এবং সম্প্রসারণ সুবিধা করা

প্রযোজ্য পরিস্থিতি

  • বড় আকারের মেশিন লার্নিং: বিশেষত বড় নমুনা আকার, উচ্চ মাত্রার কার্নেল পদ্ধতি অ্যাপ্লিকেশনের জন্য উপযুক্ত
  • বৈজ্ঞানিক গণনা: দক্ষ কার্নেল সমষ্টি প্রয়োজন এমন সংখ্যাসূচক সিমুলেশনে ব্যাপক অ্যাপ্লিকেশন সম্ভাবনা
  • রিয়েল-টাইম সিস্টেম: সহগ পূর্ব-গণনা করার পরে দ্রুত অনলাইন অনুমান বাস্তবায়ন করা যায়

সংদর্ভ

পেপারটি 52টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা কার্নেল পদ্ধতি, দ্রুত অ্যালগরিদম, সুরেলা বিশ্লেষণ এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।