In this note, we briefly present a generalized tensor CUR (GTCUR) approximation for tensor pairs (X,Y) and tensor triplets (X,Y,Z) based on the tubal product (t-product). We use the tensor Discrete Empirical Interpolation Method (TDEIM) to do these extensions. We show how the TDEIM can be utilized to generalize the classical tensor CUR (TCUR) approximation, which acts only on a single tensor, to jointly compute the TCUR of two and three tensors. This approach can be used to sample relevant lateral/horizontal slices of one data tensor relative to one or two other data tensors. For some special cases, the Generalized TCUR (GTCUR) approximation is reduced to the classical TCUR for both tensor pairs and tensor triplets in a similar fashion as shown for the matrices.
- পেপার আইডি: 2305.00754
- শিরোনাম: A note on generalized tensor CUR approximation for tensor pairs and tensor triplets based on the tubal product
- লেখক: সালমান আহমাদি-আসল (ইনোপলিস বিশ্ববিদ্যালয়), নাইম রেজাইয়ান (রাশিয়ার জনগণের বন্ধুত্ব বিশ্ববিদ্যালয়)
- শ্রেণীবিভাগ: math.NA cs.NA
- প্রকাশনার সময়: arXiv প্রিপ্রিন্ট, ২০২৩ সালের মে (সর্বশেষ সংস্করণ ২০২৫ সালের জানুয়ারি)
- পেপার লিঙ্ক: https://arxiv.org/abs/2305.00754
এই পেপারটি টিউবাল প্রোডাক্ট (t-product) এর উপর ভিত্তি করে টেনসর জোড়া (X,Y) এবং টেনসর ত্রিপদ (X,Y,Z) এর জন্য সাধারণীকৃত টেনসর CUR (GTCUR) অনুমান পদ্ধতি প্রস্তাব করে। লেখকরা এই সম্প্রসারণগুলি বাস্তবায়নের জন্য টেনসর বিচ্ছিন্ন অভিজ্ঞতামূলক ইন্টারপোলেশন পদ্ধতি (TDEIM) ব্যবহার করেন, এবং দেখান কিভাবে TDEIM ব্যবহার করে শাস্ত্রীয় টেনসর CUR (TCUR) অনুমান, যা শুধুমাত্র একটি একক টেনসরে কাজ করে, তা দুটি বা তিনটি টেনসরের যৌথ গণনার জন্য সাধারণীকৃত করা যায়। এই পদ্ধতিটি এক বা দুটি অন্যান্য ডেটা টেনসরের সাপেক্ষে একটি ডেনসর নমুনা করার জন্য প্রাসঙ্গিক পার্শ্ব/অনুভূমিক স্লাইস নির্বাচন করতে ব্যবহার করা যেতে পারে।
- সমাধানের জন্য সমস্যা: শাস্ত্রীয় CUR বিয়োজন শুধুমাত্র একক ম্যাট্রিক্স বা টেনসর পরিচালনা করতে পারে, একাধিক সম্পর্কিত ডেটা কাঠামো একযোগে পরিচালনা করতে পারে না। বাস্তব প্রয়োগে, প্রায়শই একাধিক সম্পর্কিত টেনসর ডেটা একযোগে বিশ্লেষণ করতে হয়, এবং একটি ডেটাসেট অন্যান্য ডেটাসেটের সাপেক্ষে সবচেয়ে বৈষম্যমূলক বৈশিষ্ট্য নিষ্কাশন করতে হয়।
- সমস্যার গুরুত্ব:
- বাস্তব-বিশ্বের ডেটাসেটগুলি সাধারণত বহু-মাত্রিক কাঠামো রাখে, যা ডেটা টেনসরের কাঠামো বজায় রাখার প্রয়োজন
- উপ-গোষ্ঠী আবিষ্কার, রঙিন শব্দ ডেটা পুনরুদ্ধার, প্রামাণিক সম্পর্ক বিশ্লেষণ এবং অন্যান্য প্রয়োগে একাধিক টেনসর একযোগে পরিচালনা করার প্রয়োজন
- ঐতিহ্যবাহী পদ্ধতি একাধিক টেনসরের মধ্যে সাধারণ তথ্য কার্যকরভাবে ব্যবহার করতে পারে না
- বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
- ম্যাট্রিক্স CUR (MCUR) শুধুমাত্র একক ম্যাট্রিক্স পরিচালনা করতে পারে
- বিদ্যমান টেনসর বিয়োজন পদ্ধতি যেমন Tucker বিয়োজন, CP বিয়োজন ছাঁটাই করার সময় সর্বোত্তম নিম্ন-র্যাঙ্ক অনুমান প্রদান করতে পারে না
- বহু-টেনসর পরিচালনার জন্য একীভূত কাঠামোর অভাব
- গবেষণার প্রেরণা: ম্যাট্রিক্স ক্ষেত্রে সাধারণীকৃত MCUR এর সফল প্রয়োগ দ্বারা অনুপ্রাণিত, লেখকরা এই ধারণাটি টেনসর ক্ষেত্রে প্রসারিত করতে চান, t-প্রোডাক্টের উপর ভিত্তি করে টেনসর SVD এর চমৎকার বৈশিষ্ট্য ব্যবহার করে, এবং একাধিক টেনসর একযোগে পরিচালনা করতে পারে এমন GTCUR পদ্ধতি বিকাশ করতে চান।
- সাধারণীকৃত টেনসর CUR (GTCUR) পদ্ধতি প্রস্তাব: প্রথমবারের মতো CUR অনুমান একক টেনসর থেকে টেনসর জোড়া এবং টেনসর ত্রিপদের ক্ষেত্রে প্রসারিত করা হয়েছে
- TDEIM-ভিত্তিক নমুনা কৌশল বিকাশ: টেনসর বিচ্ছিন্ন অভিজ্ঞতামূলক ইন্টারপোলেশন পদ্ধতি ব্যবহার করে সর্বোত্তম পার্শ্ব/অনুভূমিক স্লাইস নির্বাচন করা হয়েছে
- তাত্ত্বিক সংযোগ স্থাপন: প্রমাণ করা হয়েছে যে GTCUR বিশেষ ক্ষেত্রে শাস্ত্রীয় TCUR এ অবনত হতে পারে, ম্যাট্রিক্স ক্ষেত্রের মতো
- দক্ষ অ্যালগরিদম প্রদান: GTCUR গণনার জন্য দ্রুত অ্যালগরিদম প্রদান করা হয়েছে, ফুরিয়ার ডোমেনে দক্ষ বাস্তবায়ন সহ
- টেনসর বিয়োজন তত্ত্ব প্রসারিত: সাধারণীকৃত টেনসর SVD (GTSVD) এবং সীমাবদ্ধ টেনসর SVD (t-RSVD) এর উপর ভিত্তি করে সম্পূর্ণ তাত্ত্বিক কাঠামো স্থাপন করা হয়েছে
টেনসর জোড়ার GTCUR: দুটি টেনসর X∈RI1×I2×I3 এবং Y∈RI4×I2×I3 দেওয়া হলে, নিম্নলিখিত অনুমান খুঁজে পান:
X≈C1∗U1∗R1,Y≈C2∗U2∗R2
টেনসর ত্রিপদের GTCUR: তিনটি টেনসর X∈RI1×I2×I3, Y∈RI1×I4×I3, Z∈RI5×I2×I3 দেওয়া হলে, সংশ্লিষ্ট অনুমান খুঁজে পান।
পেপারটি টিউবাল প্রোডাক্ট (t-product) এর উপর ভিত্তি করে টেনসর ক্রিয়াকলাপের একটি সিরিজ সংজ্ঞায়িত করে:
- t-product: C=X∗Y=fold(circ(X)⋅unfold(Y))
- টেনসর ট্রান্সপোজ: সমস্ত সামনের স্লাইসে ট্রান্সপোজ করা এবং ক্রম বিপরীত করা
- অর্থোগোনাল টেনসর: XT∗X=X∗XT=I সন্তুষ্ট করে
X≈U∗S∗VT
যেখানে U এবং V অর্থোগোনাল টেনসর, এবং S একটি f-কর্ণ টেনসর।
মূল ধারণা হল টেনসর ইন্টারপোলেশন প্রজেকশন অপারেটর নির্মাণ করা:
P=U∗(ST∗U)−1∗ST
নমুনা প্রক্রিয়া:
- সর্বাধিক ইউক্লিডীয় নর্ম সহ প্রথম টিউবাল কাঠামো নির্বাচন করুন
- অবশিষ্টাংশ স্লাইসে সর্বাধিক নর্ম সহ সূচক পুনরাবৃত্তিমূলকভাবে নির্বাচন করুন
- ইতিমধ্যে নির্বাচিত দিকগুলির প্রভাব সরাতে প্রজেকশন অপারেটর ব্যবহার করুন
- একীভূত বহু-টেনসর প্রক্রিয়াকরণ কাঠামো: ভাগ করা ফ্যাক্টর ম্যাট্রিক্সের মাধ্যমে বহু-টেনসর যৌথ বিয়োজন বাস্তবায়ন করা
- GTSVD-ভিত্তিক সূচক নির্বাচন: সাধারণীকৃত টেনসর SVD দ্বারা প্রদত্ত সাধারণ ফ্যাক্টর ব্যবহার করে সামঞ্জস্যপূর্ণ স্লাইস নমুনা করা
- ফুরিয়ার ডোমেন দক্ষ গণনা: সমস্ত ক্রিয়াকলাপ ফ্রিকোয়েন্সি ডোমেনে সমান্তরালভাবে সম্পাদিত হতে পারে, যা গণনার দক্ষতা উল্লেখযোগ্যভাবে বৃদ্ধি করে
- তাত্ত্বিক গ্যারান্টি: ত্রুটি উপরের সীমা প্রদান করা হয় ∥X−C∗U∗R∥F2≤(η~p+η~q)∑i=1I3∑t>R(σti)2
পেপারটি প্রধানত তাত্ত্বিক বিশ্লেষণ এবং অ্যালগরিদম কাঠামো প্রদান করে, যার মধ্যে রয়েছে:
- অনুমান ত্রুটির তাত্ত্বিক উপরের সীমা
- গণনামূলক জটিলতা বিশ্লেষণ
- শর্ত সংখ্যা নিয়ন্ত্রণ
- শাস্ত্রীয় টেনসর CUR (TCUR)
- leverage scores এর উপর ভিত্তি করে নমুনা পদ্ধতি
- সমান নমুনা পদ্ধতি
- দ্রুত ফুরিয়ার রূপান্তর (FFT) ব্যবহার করে t-product বাস্তবায়ন করা
- গণনামূলক জটিলতা হ্রাস করতে র্যান্ডমাইজড GTSVD গ্রহণ করা
- MATLAB শৈলীর অ্যালগরিদম বর্ণনা প্রদান করা
পেপারটি প্রধানত তাত্ত্বিক ফলাফল প্রদান করে:
- উপপাদ্য ১: TDEIM নমুনা TCUR অনুমান ত্রুটির উপরের সীমা
- উপপাদ্য ३: টেনসর জোড়া GTCUR এবং শাস্ত্রীয় TCUR এর সংযোগ সম্পর্ক
- উপপাদ্য ४: টেনসর ত্রিপদ GTCUR এর বিশেষ ক্ষেত্র বিশ্লেষণ
- যখন Y=I, GTCUR শাস্ত্রীয় TCUR এ অবনত হয়
- বিপরীতযোগ্য টেনসর Y এর জন্য, GTCUR X∗Y−1 এর TCUR এর সমতুল্য
- শর্ত সংখ্যা η~p এবং η~q দ্বারা নিয়ন্ত্রিত হয়
- ম্যাট্রিক্স CUR বিয়োজন: Goreinov এবং অন্যদের শাস্ত্রীয় কাজ
- টেনসর বিয়োজন: Tucker বিয়োজন, CP বিয়োজন, tensor-train বিয়োজন
- t-product-ভিত্তিক পদ্ধতি: Kilmer এবং অন্যদের দ্বারা প্রতিষ্ঠিত কাঠামো
- সাধারণীকৃত SVD: ম্যাট্রিক্স ক্ষেত্রে GSVD এবং RSVD
বিদ্যমান কাজের তুলনায়, এই পেপারটি প্রথমবারের মতো:
- CUR বিয়োজন বহু-টেনসর ক্ষেত্রে প্রসারিত করা
- t-product এর উপর ভিত্তি করে সম্পূর্ণ তাত্ত্বিক কাঠামো স্থাপন করা
- দক্ষ TDEIM নমুনা অ্যালগরিদম প্রদান করা
- সফলভাবে CUR অনুমান একক টেনসর থেকে টেনসর জোড়া এবং ত্রিপদে প্রসারিত করা হয়েছে
- TDEIM সর্বোত্তম নমুনা কৌশল প্রদান করে
- তাত্ত্বিক কাঠামো সম্পূর্ণ, ত্রুটি বিশ্লেষণ এবং বিশেষ ক্ষেত্রের সংযোগ অন্তর্ভুক্ত
- অ্যালগরিদম দক্ষ, ফুরিয়ার ডোমেনে সমান্তরাল গণনা করা যায়
- সংখ্যাগত পরীক্ষার অভাব: পেপারটি প্রধানত তাত্ত্বিক, নির্দিষ্ট সংখ্যাগত যাচাইকরণ প্রদান করে না
- গণনামূলক জটিলতা: GTSVD এর গণনা বড় আকারের টেনসরের জন্য এখনও চ্যালেঞ্জ
- প্রয়োগের দৃশ্য: নির্দিষ্ট প্রয়োগের দৃশ্যের বিস্তারিত বিশ্লেষণের অভাব
- পরামিতি নির্বাচন: র্যাঙ্ক পরামিতি R এর নির্বাচন কৌশল আলোচনা করা হয়নি
- বাস্তব প্রয়োগে পদ্ধতির কার্যকারিতা যাচাই করা
- আরও দক্ষ র্যান্ডমাইজড অ্যালগরিদম বিকাশ করা
- পরামিতি নির্বাচনের স্বয়ংক্রিয় কৌশল গবেষণা করা
- উচ্চতর অর্ডার টেনসরের ক্ষেত্রে প্রসারিত করা
- উল্লেখযোগ্য তাত্ত্বিক অবদান: প্রথমবারের মতো বহু-টেনসর CUR বিয়োজনের সম্পূর্ণ তাত্ত্বিক কাঠামো স্থাপন করা হয়েছে
- উদ্ভাবনী পদ্ধতি: GTSVD এর সাধারণ ফ্যাক্টর ব্যবহার করে বহু-টেনসর যৌথ প্রক্রিয়াকরণ বাস্তবায়নের চমৎকার ধারণা
- দক্ষ অ্যালগরিদম: FFT-ভিত্তিক বাস্তবায়ন গণনামূলক দক্ষতা নিশ্চিত করে
- কঠোর তাত্ত্বিক বিশ্লেষণ: সম্পূর্ণ ত্রুটি বিশ্লেষণ এবং সংগ্রহ গ্যারান্টি প্রদান করা হয়েছে
- স্পষ্ট লেখা: পেপারের কাঠামো স্পষ্ট, গাণিতিক অনুমান কঠোর
- পরীক্ষামূলক যাচাইকরণের অভাব: একটি তাত্ত্বিক note হিসাবে, পদ্ধতির বাস্তব প্রভাব যাচাই করার জন্য সংখ্যাগত পরীক্ষার অভাব
- অপর্যাপ্ত প্রয়োগ প্রেরণা: যদিও কিছু প্রয়োগ উল্লেখ করা হয়েছে, নির্দিষ্ট প্রয়োগের দৃশ্যের গভীর আলোচনা নেই
- স্কেলেবিলিটি সমস্যা: অত্যন্ত বড় আকারের টেনসরের জন্য, GTSVD এর গণনা এখনও বাধা
- পরামিতি সংবেদনশীলতা: পরামিতি নির্বাচনের প্রতি পদ্ধতির সংবেদনশীলতা আলোচনা করা হয়নি
- তাত্ত্বিক মূল্য: বহু-টেনসর বিশ্লেষণের জন্য নতুন তাত্ত্বিক সরঞ্জাম প্রদান করা
- ব্যবহারিক সম্ভাবনা: চিত্র প্রক্রিয়াকরণ, সংকেত বিশ্লেষণ এবং অন্যান্য ক্ষেত্রে প্রয়োগের সম্ভাবনা
- পুনরুৎপাদনযোগ্যতা: বিস্তারিত অ্যালগরিদম বর্ণনা প্রদান করা হয়েছে, বাস্তবায়ন সহজ করে
- পরবর্তী গবেষণা: সম্পর্কিত ক্ষেত্রের আরও গবেষণার জন্য ভিত্তি স্থাপন করা
- বহু-মোডাল ডেটা বিশ্লেষণ: একাধিক সম্পর্কিত টেনসর ডেটা একযোগে প্রক্রিয়া করার প্রয়োজনীয় দৃশ্য
- বৈশিষ্ট্য নির্বাচন: একটি ডেটাসেট অন্যান্য ডেটাসেটের সাপেক্ষে বৈষম্যমূলক বৈশিষ্ট্য নিষ্কাশন করা
- শব্দ ডেটা পুনরুদ্ধার: একাধিক টেনসরের সাধারণ কাঠামো ব্যবহার করে ডেটা পুনরুদ্ধার করা
- মাত্রা হ্রাস: টেনসর কাঠামো বজায় রেখে মাত্রা হ্রাস করা
পেপারটি ২৪টি গুরুত্বপূর্ণ সংদর্ভ উদ্ধৃত করে, যার মধ্যে প্রধানত রয়েছে:
- Goreinov এবং অন্যদের CUR বিয়োজনের শাস্ত্রীয় কাজ
- Kilmer এবং অন্যদের t-product এর উপর প্রতিষ্ঠিত গবেষণা
- Gidisu এবং Hochstenbach এর ম্যাট্রিক্স GMCUR এর সর্বশেষ কাজ
- বিভিন্ন টেনসর বিয়োজন পদ্ধতির সম্পর্কিত সাহিত্য
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের তাত্ত্বিক পেপার, যা সফলভাবে CUR বিয়োজন বহু-টেনসর ক্ষেত্রে প্রসারিত করেছে এবং সম্পূর্ণ তাত্ত্বিক কাঠামো স্থাপন করেছে। যদিও সংখ্যাগত পরীক্ষার অভাব রয়েছে, তবে তাত্ত্বিক অবদান উল্লেখযোগ্য এবং বহু-টেনসর বিশ্লেষণের জন্য নতুন সরঞ্জাম প্রদান করে। পেপারের প্রধান মূল্য তাত্ত্বিক উদ্ভাবন এবং পদ্ধতিগত অবদানে নিহিত, যা পরবর্তী বাস্তব প্রয়োগ গবেষণার জন্য দৃঢ় ভিত্তি স্থাপন করে।