2025-11-29T09:13:18.768533

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

Xiao, Zeng

Tensors, especially higher-order tensors, are typically represented in low-rank formats to preserve the main information of the high-dimensional data while saving memory space. In practice, only a small fraction elements in high-dimensional data are of interest, such as the $k$ largest or smallest elements. Thus, retrieving the $k$ largest/smallest elements from a low-rank tensor is a fundamental and important task in a wide variety of applications. In this paper, we first model the top-$k$ elements retrieval problem to a continuous constrained optimization problem. To address the equivalent optimization problem, we develop a block-alternating iterative algorithm that decomposes the original problem into a sequence of small-scale subproblems. Leveraging the separable summation structure of the objective function, a heuristic algorithm is proposed to solve these subproblems in an alternating manner. Numerical experiments with tensors from synthetic and real-world applications demonstrate that the proposed algorithm outperforms existing methods in terms of accuracy and stability.

academic

गुणनखंडित टेंसर से शीर्ष- $k$ तत्वों को पुनः प्राप्त करने के लिए एक नवीन ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम

मूल जानकारी

पेपर ID: 2511.07898
शीर्षक: गुणनखंडित टेंसर से शीर्ष- $k$ तत्वों को पुनः प्राप्त करने के लिए एक नवीन ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम
लेखक: चुआनफु जिओ, जियाक्सिन जेंग (शांगतान विश्वविद्यालय गणित और कम्प्यूटेशनल विज्ञान कॉलेज, पेंगचेंग प्रयोगशाला ब्रॉडबैंड संचार विभाग)
वर्गीकरण: math.NA (संख्यात्मक विश्लेषण), cs.NA (कम्प्यूटर संख्यात्मक विश्लेषण)
प्रकाशन तिथि: 11 नवंबर 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2511.07898v1

सारांश

उच्च-क्रम टेंसर को आमतौर पर निम्न-रैंक प्रारूप में प्रदर्शित किया जाता है, जो मेमोरी बचाते हुए उच्च-आयामी डेटा की मुख्य जानकारी को संरक्षित करता है। व्यावहारिक अनुप्रयोगों में, अक्सर डेटा के केवल एक छोटे हिस्से पर ध्यान दिया जाता है, जैसे कि सबसे बड़े या सबसे छोटे $k$ तत्व। यह पेपर निम्न-रैंक टेंसर से शीर्ष- $k$ तत्वों को पुनः प्राप्त करने की इस मौलिक समस्या को संबोधित करता है, पहले इसे एक सतत बाधित अनुकूलन समस्या के रूप में मॉडल करके, फिर एक ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम विकसित करके जो मूल समस्या को छोटी-छोटी उप-समस्याओं में विघटित करता है। उद्देश्य फ़ंक्शन की वियोज्य योग संरचना का उपयोग करते हुए, एक अनुमानी एल्गोरिदम प्रस्तावित किया गया है जो इन उप-समस्याओं को वैकल्पिक तरीके से हल करता है। सिंथेटिक डेटा और वास्तविक अनुप्रयोग टेंसर पर संख्यात्मक प्रयोग दिखाते हैं कि एल्गोरिदम सटीकता और स्थिरता के मामले में मौजूदा तरीकों से बेहतर है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. समस्या को हल करने के लिए

गुणनखंडित टेंसर (factorized tensor) से शीर्ष- $k$ सबसे बड़े या सबसे छोटे तत्वों और उनके स्थानों को कुशलतापूर्वक और सटीक रूप से पुनः प्राप्त करना। यहाँ गुणनखंडित टेंसर CP, Tucker, TT आदि निम्न-रैंक विघटन प्रारूपों में प्रदर्शित उच्च-आयामी डेटा को संदर्भित करता है।

2. समस्या का महत्व

अनुशंसा प्रणाली: सबसे बड़े $k$ तत्व सबसे अर्थपूर्ण व्यक्तिगतकृत अनुशंसाओं के अनुरूप हैं
क्वांटम सिमुलेशन: क्वांटम अवस्थाओं को आमतौर पर मेमोरी उपयोग को कम करने के लिए टेंसर विघटन में प्रदर्शित किया जाता है, अधिकतम संभावना अनुमान गुणनखंडित टेंसर में अधिकतम आयाम तत्वों को पुनः प्राप्त करने के बराबर है
वैज्ञानिक कम्प्यूटिंग: सिमुलेशन डेटा, हाइपरस्पेक्ट्रल छवियों, वीडियो आदि उच्च-आयामी डेटा की मुख्य जानकारी निष्कर्षण
अनुकूलन समस्याएं: कई व्यावहारिक कार्यों को शीर्ष- $k$ तत्व पुनः प्राप्ति समस्या के रूप में मॉडल किया जा सकता है

3. मौजूदा तरीकों की सीमाएं

नमूनाकरण विधियां (जैसे star sampling):

सटीकता नमूना आकार और गुणवत्ता पर अत्यधिक निर्भर है
गुणनखंडित टेंसर की अंतर्निहित संरचना से प्रभावित, अस्थिर प्रदर्शन
केवल $k>1$ के लिए उपयुक्त, न्यूनतम तत्वों को पुनः प्राप्त करने के लिए सीधे सामान्यीकृत नहीं किया जा सकता

सतत अनुकूलन विधियां:

शक्ति पुनरावृत्ति/व्युत्क्रम पुनरावृत्ति: Hadamard उत्पाद टेंसर रैंक के तेजी से वृद्धि का कारण बनता है, पुनः संपीड़न संचालन की आवश्यकता होती है, संचित त्रुटि स्थान निर्धारण विफलता का कारण बन सकती है
प्रक्षेपित ढाल वंश (PGD): हाइपरपैरामीटर (जैसे चरण आकार) चयन के लिए अत्यधिक संवेदनशील, विभिन्न कार्यों में अस्थिर प्रदर्शन
मौजूदा एल्गोरिदम $k>1$ के मामले में सीधे लागू नहीं किए जा सकते

4. अनुसंधान प्रेरणा

सममित eigenvalue मॉडल (Espig et al. 2013, 2020) के आधार पर, लेखकों ने देखा कि eigenvector के अनुरूप टेंसर में रैंक-एक संरचना है, जिससे नई समतुल्य सतत बाधित अनुकूलन पुनर्निर्माण प्रस्तावित की गई है, और ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम को कुशलतापूर्वक हल करने के लिए डिज़ाइन किया गया है।

मुख्य योगदान

मॉडलिंग योगदान: eigenvector के अनुरूप टेंसर की रैंक-एक संरचना के आधार पर, शीर्ष- $k$ तत्व पुनः प्राप्ति समस्या को सतत बाधित अनुकूलन समस्या के रूप में मॉडल किया गया है (प्रमेय 1)
एल्गोरिदम योगदान: समतुल्य अनुकूलन समस्या को हल करने के लिए एक नवीन ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम प्रस्तावित किया गया है, उद्देश्य फ़ंक्शन की वियोज्य योग संरचना का उपयोग करके अनुमानी विधि डिज़ाइन की गई है
अनुप्रयोग योगदान: एल्गोरिदम को क्वांटम सर्किट सिमुलेशन के माप चरण में लागू किया गया है, संख्यात्मक परिणाम मौजूदा एल्गोरिदम से बेहतर हैं
प्रदर्शन लाभ:
- सार्वभौमिकता: अधिकतम/न्यूनतम $k$ तत्वों और उनके स्थानों को पुनः प्राप्त कर सकता है
- स्थिरता: विभिन्न वितरण के गुणनखंडित टेंसर पर सटीकता में उल्लेखनीय सुधार

विधि विवरण

कार्य परिभाषा

इनपुट: $d$ -क्रम CP टेंसर $\mathcal{A} \in \mathbb{R}^{n_1 \times n_2 \times \cdots \times n_d}$ , जिसे इस प्रकार प्रदर्शित किया गया है: $\mathcal{A} := \sum_{r=1}^{R} \mathbf{U}_1(:,r) \circ \mathbf{U}_2(:,r) \circ \cdots \circ \mathbf{U}_d(:,r)$ जहाँ $\circ$ टेंसर बाहरी उत्पाद को दर्शाता है, $\{\mathbf{U}_p \in \mathbb{R}^{n_p \times R}: p=1,\ldots,d\}$ CP कारक हैं, $R$ CP रैंक है।

आउटपुट: $k$ सबसे बड़े (या सबसे छोटे) तत्वों के मान और संबंधित बहु-आयामी सूचकांक स्थान।

उद्देश्य: टेंसर को पूरी तरह से पुनः प्राप्त किए बिना, गुणनखंडित प्रतिनिधित्व से सीधे कुशलतापूर्वक पुनः प्राप्त करना।

मॉडल आर्किटेक्चर

पहला चरण: समस्या मॉडलिंग (प्रमेय 1)

शीर्ष- $k$ पुनः प्राप्ति समस्या को सममित eigenvalue समस्या में परिवर्तित करना। मुख्य अवलोकन: विकर्ण मैट्रिक्स $\mathbf{A}$ (टेंसर के सभी तत्वों से बना) के eigenvector में रैंक-एक संरचना है।

अनुकूलन समस्या 2.5 (मुख्य मॉडलिंग): $\max_{\mathbf{X}_p \in \mathbb{R}^{n_p \times k}} \sum_{j=1}^{k} \sum_{r=1}^{R} \prod_{p=1}^{d} \langle \mathbf{X}_p(:,j), \mathbf{U}_p(:,r) * \mathbf{X}_p(:,j) \rangle$

बाधा शर्तें:

$\|\mathbf{X}_p(:,j)\|_2 = 1$ सभी $p=1,\ldots,d; j=1,\ldots,k$ के लिए
$\prod_{p=1}^{d} \langle \mathbf{X}_p(:,i), \mathbf{X}_p(:,j) \rangle = \begin{cases} 1, & i=j \\ 0, & i \neq j \end{cases}$

जहाँ $*$ Hadamard उत्पाद को दर्शाता है, $\langle \cdot, \cdot \rangle$ आंतरिक उत्पाद को दर्शाता है।

स्केल विश्लेषण: समस्या का स्केल $\sum_{p=1}^{d} n_p k$ है, उद्देश्य फ़ंक्शन गणना केवल $n_p$ -आयामी वेक्टर के Hadamard उत्पाद को शामिल करती है, पूर्ण टेंसर पुनः प्राप्ति से बचा जाता है।

दूसरा चरण: ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम (एल्गोरिदम 1)

मुख्य विचार: गैर-रैखिक Gauss-Seidel पुनरावृत्ति से प्रेरित, हर बार केवल $s$ लक्ष्य चर $\{\mathbf{X}_{p_1}, \ldots, \mathbf{X}_{p_s}\}$ को अपडेट करते हैं, बड़ी समस्या को छोटी उप-समस्याओं में विघटित करते हैं।

उप-समस्या रूप (प्रमेय 2): $\max_{\{\mathbf{X}_q: q \in \{p_1,\ldots,p_s\}\}} \sum_{j,r=1}^{k,R} \alpha_r^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q(:,j) \rangle$

जहाँ गुणांक: $\alpha_{r,j}^t = \prod_{q \notin \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q^t(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q^t(:,j) \rangle$

उप-समस्या स्केल $\sum_{q \in \{p_1,\ldots,p_s\}} n_q k$ तक कम हो जाता है।

तीसरा चरण: अनुमानी समाधान विधि

मुख्य अवलोकन: उद्देश्य फ़ंक्शन में वियोज्य योग संरचना है: $f_1(\mathbf{X}_{p_1}(:,1), \ldots, \mathbf{X}_{p_s}(:,1)) + \cdots + f_k(\mathbf{X}_{p_1}(:,k), \ldots, \mathbf{X}_{p_s}(:,k))$

समाधान रणनीति: क्रम में $1 \to 2 \to \cdots \to k$ समाधान निर्धारित करते हैं, जो स्थानीय इष्टतमता को संतुष्ट करते हैं।

$j=1$ के लिए: $(\mathbf{X}_{p_1}^*(:,1), \ldots, \mathbf{X}_{p_s}^*(:,1)) = \arg\max f_1$ $s$ -क्रम CP टेंसर $\sum_{r=1}^{R} \alpha_{r,1}^t \mathbf{U}_{p_1}(:,r) \circ \cdots \circ \mathbf{U}_{p_s}(:,r)$ के सबसे बड़े तत्व को पुनः प्राप्त करने के बराबर है।

$j>1$ के लिए: बाधा $\beta_{r,i,j}^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,i), \mathbf{X}_q(:,j) \rangle = 0$ (सभी $i<j$ के लिए) को संतुष्ट करना आवश्यक है।

दो मामले:

यदि $\beta_{r,i,j}^t = 0$ : बाधा अप्रभावी है, सीधे सबसे बड़े तत्व को पुनः प्राप्त करें
अन्यथा: ऑर्थोगोनैलिटी शर्त को संतुष्ट करने वाले सबसे बड़े तत्व को खोजें

तकनीकी नवाचार बिंदु

रैंक-एक संरचना उपयोग: पहली बार स्पष्ट रूप से eigenvector के अनुरूप टेंसर की रैंक-एक संरचना का उपयोग अनुकूलन समस्या को सरल बनाने के लिए, उच्च-आयामी टेंसर को सीधे संभालने से बचा जाता है
ब्लॉक विघटन रणनीति: ब्लॉक पैरामीटर $s$ के माध्यम से उप-समस्या स्केल और खोज स्थान आकार को नियंत्रित करते हैं, दक्षता और सटीकता को संतुलित करते हैं
वियोज्य योग उपयोग: उद्देश्य फ़ंक्शन की वियोज्यता का कुशलतापूर्वक उपयोग करते हैं, $k$ समाधानों के संयुक्त अनुकूलन को क्रमिक अनुकूलन में परिवर्तित करते हैं
बाधा प्रबंधन: $\beta_{r,i,j}^t$ गुणांक के माध्यम से बाधा प्रभावशीलता को कुशलतापूर्वक निर्धारित करते हैं, घातीय जटिलता से बचा जाता है
सार्वभौमिक डिजाइन:
- अधिकतम/न्यूनतम तत्व पुनः प्राप्ति केवल अनुकूलन दिशा बदलने की आवश्यकता है
- जटिल टेंसर के वास्तविक/काल्पनिक भाग पुनः प्राप्ति का समर्थन करता है
- Tucker, TT आदि अन्य टेंसर प्रारूपों पर लागू किया जा सकता है

प्रयोगात्मक सेटअप

डेटासेट

1. सिंथेटिक डेटा (प्रयोग 4.1)

यादृच्छिक CP टेंसर: 100 यादृच्छिक रूप से उत्पन्न CP टेंसर
पैरामीटर सेटिंग:
- क्रम $d \in [3, 10]$ (यादृच्छिक पूर्णांक)
- आयाम $n_p \in [2, 15-d]$ (यादृच्छिक पूर्णांक)
- CP रैंक $R \in [2, 10]$ (यादृच्छिक पूर्णांक)
वितरण प्रकार: CP कारक समान वितरण $U(-1,1)$ , $U(0,0.75)$ , $U(0,1)$ का पालन करते हैं

2. बहुभिन्नरूपी फ़ंक्शन द्वारा उत्पन्न CP टेंसर (प्रयोग 4.2)

Griewank फ़ंक्शन: $f(\mathbf{z}) = \sum_{p=1}^{d} \frac{z_p^2}{4000} - \prod_{p=1}^{d} \cos(\frac{z_p}{\sqrt{p}}) + 1$ , $z_p \in [-600, 600]$
Schwefel फ़ंक्शन: $f(\mathbf{z}) = 418.9829d - \sum_{p=1}^{d} z_p \sin(\sqrt{|z_p|})$ , $z_p \in [-500, 500]$
आयाम: $d=10$
ग्रिड आकार: प्रत्येक आयाम $n \in \{128, 256, 512, 1024\}$

3. क्वांटम सर्किट सिमुलेशन (प्रयोग 4.3)

क्वांटम फूरियर ट्रांसफॉर्म (QFT) सर्किट
क्वांटम बिट संख्या: $d \in \{9, 16, 25, 36, 49\}$ ( $d=l^2$ , $l \in \{3,4,5,6,7\}$ )
उप-स्थान CP मॉडल: क्वांटम अवस्था को $p$ -क्रम टेंसर में पुनः व्यवस्थित करें ( $d=pq$ , $p=q=l$ )
प्रारंभिक अवस्था: यादृच्छिक रूप से उत्पन्न रैंक-एक टेंसर, CP कारक तत्व जटिल संख्याएं हैं, वास्तविक और काल्पनिक भाग $U(0,1)$ का पालन करते हैं

मूल्यांकन संकेतक

सटीकता (Accuracy): $\text{Accuracy} = \frac{\#\text{hit}}{S}$ जहाँ $\#\text{hit}$ सफलतापूर्वक पहचाने गए अधिकतम/न्यूनतम तत्वों की संख्या है, $S=100$ परीक्षण टेंसर की संख्या है
तत्व मान (Value): पुनः प्राप्त शीर्ष- $k$ तत्वों का मान या उनका योग, वास्तविक मान से निकटता का मूल्यांकन करने के लिए
स्थिरता: विभिन्न वितरण के तहत मान वितरण और आउटलायर को दिखाने के लिए बॉक्स प्लॉट के माध्यम से

तुलना विधियां

Power Iteration (Espig et al. 2020):
- शक्ति पुनरावृत्ति विधि, CP रैंक 10 से अधिक होने पर पुनः संपीड़न प्रस्तुत करता है
- स्थानांतरण परिवर्तन लागू करके टेंसर को गैर-नकारात्मक बनाता है
- रैंक-एक सन्निकटन के माध्यम से अधिकतम तत्व स्थान निर्धारित करता है
Star Sampling (Lu et al. 2017):
- नमूनाकरण विधि, नोड संख्या=2, नमूना संख्या= $\min(10^4, \lfloor 20\% \times \#P(\mathcal{A}) \rfloor)$
- वेरिएंट: Star Sampling+1, Star Sampling+5 (खोज स्थान विस्तार)
MinCPD via Frank-Wolfe (Sidiropoulos et al. 2023):
- प्रक्षेपित ढाल वंश विधि
- केवल $k=1$ के मामले में लागू

कार्यान्वयन विवरण

प्रोग्रामिंग वातावरण: Python + TensorLy लाइब्रेरी (NumPy बैकएंड)
हार्डवेयर प्लेटफॉर्म: लैपटॉप कंप्यूटर
इस पेपर के एल्गोरिदम पैरामीटर:
- ब्लॉक पैरामीटर $s \in \{1, 2\}$
- विस्तार पैरामीटर $K \in \{1, 5\}$
- नोटेशन: Ours( $s$ )+ $K$ ब्लॉक पैरामीटर $s$ , खोज स्थान $k+K$ तक विस्तारित को दर्शाता है

प्रयोगात्मक परिणाम

मुख्य परिणाम

प्रयोग 4.1: यादृच्छिक CP टेंसर ( $k=1$ , अधिकतम तत्व पुनः प्राप्ति)

सटीकता तुलना (चित्र 3d):

$U(-1,1)$ वितरण:
- Power Iteration: ~25%, Star Sampling: ~15%, MinCPD: ~11%
- Ours(1)+1: ~52% (108.0%, 246.7%, 372.7% सुधार)
$U(0,0.75)$ वितरण:
- Power Iteration: ~68%, Star Sampling: ~42%, MinCPD: ~52%
- Ours(1)+1: ~79% (16.2%, 88.1%, 51.9% सुधार)
$U(0,1)$ वितरण:
- Power Iteration: ~62%, Star Sampling: ~28%, MinCPD: ~53%
- Ours(1)+1: ~60% (सर्वोत्तम स्थिरता)

मुख्य निष्कर्ष:

Star Sampling $U(-1,1)$ वितरण के तहत वास्तविक मान से दूर है (चित्र 3a)
MinCPD संख्यात्मक पैमाने के प्रति संवेदनशील है
यह एल्गोरिदम सभी वितरणों के तहत स्थिर रहता है, सटीकता 50% से अधिक है

प्रयोग 4.1: यादृच्छिक CP टेंसर ( $k=1$ , न्यूनतम तत्व पुनः प्राप्ति)

सटीकता तुलना (चित्र 4d):

MinCPD सभी वितरणों के तहत सटीकता ≤40%
Ours(1)+1 48.0%~93.0% तक पहुंचता है
Ours(2)+5 सटीकता को और बढ़ाता है

मान तुलना (चित्र 4a): इस एल्गोरिदम द्वारा प्राप्त मान आमतौर पर छोटे होते हैं (वास्तविक न्यूनतम मान के करीब)

प्रयोग 4.1: यादृच्छिक CP टेंसर ( $k=5$ , अधिकतम तत्व पुनः प्राप्ति)

सटीकता तुलना (चित्र 5d):

Star Sampling: <45% (सभी वितरण)
Ours(1)+1: 59.0% ( $U(-1,1)$ ), 84.0% ( $U(0,0.75)$ ), 82.0% ( $U(0,1)$ )
Ours(2)+5: 87.8% तक पहुंचता है

मान तुलना (चित्र 5a): Star Sampling $U(-1,1)$ के तहत योग <0 (गंभीर विचलन)

प्रयोग 4.1: यादृच्छिक CP टेंसर ( $k=5$ , न्यूनतम तत्व पुनः प्राप्ति)

सटीकता (चित्र 6d):

Ours(1)+1: 55.2%~87.8%
Ours(2)+5: आगे सुधार, 87.8% तक पहुंचता है

पैरामीटर प्रभाव:

ब्लॉक पैरामीटर $s$ बढ़ाएं: खोज स्थान विस्तारित करें, सटीकता बढ़ाएं
विस्तार पैरामीटर $K$ बढ़ाएं: $U(-1,1)$ वितरण के लिए उल्लेखनीय सुधार (21.0%~188.9% सुधार)

प्रयोग 4.2: बहुभिन्नरूपी फ़ंक्शन CP टेंसर (न्यूनतम तत्व पुनः प्राप्ति)

औसत न्यूनतम मान तुलना (तालिका 1):

Griewank फ़ंक्शन:
- $n=128$ : MinCPD=22.87, Ours(2)=8.79 (14.08 छोटा)
- $n=1024$ : MinCPD=1.82, Ours(2)=1.68 (0.14 छोटा)
Schwefel फ़ंक्शन:
- $n=128$ : MinCPD=507.44, Ours(2)=212.00 (295.44 छोटा)
- $n=1024$ : MinCPD=178.04, Ours(2)=36.25 (141.79 छोटा)

स्थिरता (चित्र 7): MinCPD के अधिक आउटलायर हैं, यह एल्गोरिदम अधिक स्थिर है

प्रयोग 4.3: क्वांटम सर्किट सिमुलेशन

सटीकता (चित्र 9):

9 क्वांटम बिट (CP रैंक=8): Ours(2)+5 100% तक पहुंचता है ( $k=5$ )
16 क्वांटम बिट (CP रैंक=20): Ours(2)+5 90.6% तक पहुंचता है
25 क्वांटम बिट (CP रैंक=56): Ours(2)+5 90.2% तक पहुंचता है
आधार विधियां क्वांटम बिट संख्या बढ़ने के साथ सटीकता में कमी करती हैं, यह एल्गोरिदम स्थिर रहता है

मान तुलना (तालिका 2, $k=5$ ):

49 क्वांटम बिट:
- Power Iteration: $1.19 \times 10^{-12}$ (गंभीर विफलता)
- Star Sampling+5: $2.22 \times 10^{-7}$
- Ours(2)+5: $9.97 \times 10^{-7}$ (अधिकतम)

मुख्य निष्कर्ष:

Power Iteration बड़ी समस्याओं पर विफल (त्रुटि प्रभावी)
यह एल्गोरिदम 36 और 49 क्वांटम बिट (मेमोरी अपर्याप्त, वास्तविक मान सत्यापित नहीं किया जा सकता) पर भी अधिकतम मान प्राप्त करता है
स्थिरता समस्या स्केल के साथ नहीं घटती

विलोपन प्रयोग

यद्यपि पेपर स्पष्ट रूप से विलोपन प्रयोग को चिह्नित नहीं करता है, लेकिन पैरामीटर परिवर्तन के माध्यम से घटक योगदान प्रदर्शित किया गया है:

ब्लॉक पैरामीटर $s$ का प्रभाव:
- $s=1 \to s=2$ : सटीकता में सुधार, विशेष रूप से $U(-1,1)$ वितरण में
- लागत: कम्प्यूटेशनल और मेमोरी ओवरहेड बढ़ता है
विस्तार पैरामीटर $K$ का प्रभाव:
- $K=1 \to K=5$ : कठिन वितरण ( $U(-1,1)$ ) की सटीकता में उल्लेखनीय सुधार
- सरल वितरण ( $U(0,1)$ ) के लिए सुधार सीमित है

केस विश्लेषण

पेपर दृश्य प्रदर्शन के माध्यम से (चित्र 3-7, चित्र 9):

बॉक्स प्लॉट मान वितरण और स्थिरता दिखाते हैं
सटीकता बार चार्ट विभिन्न विधियों की तुलना करते हैं
क्वांटम सर्किट प्रयोग वास्तविक अनुप्रयोग प्रभाव प्रदर्शित करते हैं

प्रयोगात्मक निष्कर्ष

डेटा वितरण संवेदनशीलता: सभी विधियां डेटा वितरण के प्रति संवेदनशील हैं, लेकिन यह एल्गोरिदम अपेक्षाकृत सबसे स्थिर है
स्केल दृढ़ता: आधार विधियां बड़ी समस्याओं पर प्रदर्शन में गिरावट करती हैं, यह एल्गोरिदम स्थिर रहता है
सार्वभौमिकता सत्यापन: अधिकतम/न्यूनतम तत्व पुनः प्राप्ति, विभिन्न $k$ मान, जटिल टेंसर में सफलतापूर्वक लागू
पैरामीटर ट्यूनिंग महत्व: $s$ और $K$ को उचित रूप से सेट करना सटीकता के लिए महत्वपूर्ण है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

रैंक-एक संरचना के आधार पर सतत बाधित अनुकूलन मॉडलिंग प्रस्तावित की गई है (प्रमेय 1)
ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम विकसित किया गया है, जो बड़ी समस्याओं को प्रभावी रूप से विघटित करता है
संख्यात्मक प्रयोग कई परिदृश्यों में एल्गोरिदम की श्रेष्ठता सत्यापित करते हैं:
- सटीकता सुधार: 16%~373% (आधार विधियों की तुलना में)
- स्थिरता: विभिन्न डेटा वितरणों के लिए दृढ़
- सार्वभौमिकता: अधिकतम/न्यूनतम, विभिन्न $k$ मान, जटिल टेंसर का समर्थन करता है
क्वांटम सर्किट सिमुलेशन में वास्तविक अनुप्रयोग मान प्रदर्शित किया गया है

सीमाएं

कम्प्यूटेशनल जटिलता:
- उप-समस्या समाधान के लिए $s$ -क्रम CP टेंसर को पूर्ण टेंसर में पुनः प्राप्त करना आवश्यक है
- समय जटिलता: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q R + \prod_{q} n_q \log(\prod_q n_q)$
- मेमोरी जटिलता: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q$
पैरामीटर संवेदनशीलता:
- ब्लॉक पैरामीटर $s$ को समस्या स्केल के अनुसार समायोजित करने की आवश्यकता है
- विस्तार पैरामीटर $K$ का इष्टतम मान डेटा वितरण पर निर्भर करता है
स्थानीय इष्टतमता:
- अनुमानी विधि वैश्विक इष्टतमता की गारंटी नहीं देती है
- क्रमिक समाधान निर्धारण बेहतर संयोजन को याद कर सकता है
सैद्धांतिक विश्लेषण की कमी:
- अभिसरण प्रमाण प्रदान नहीं किया गया है
- त्रुटि सीमा विश्लेषण की कमी है
लागू क्षेत्र:
- मुख्य रूप से CP प्रारूप के लिए, हालांकि Tucker/TT तक सामान्यीकृत किया जा सकता है लेकिन पर्याप्त रूप से सत्यापित नहीं किया गया है
- चरम वितरण ( $U(-1,1)$ ) के लिए सटीकता में अभी भी सुधार की गुंजाइश है

भविष्य की दिशाएं

पेपर द्वारा स्पष्ट रूप से प्रस्तावित दिशाएं:

अधिक व्यावहारिक परिदृश्यों में अनुप्रयोग: अनुशंसा प्रणाली, नेटवर्क माप, कम्प्यूटेशनल जीव विज्ञान
मौजूदा अधिकतम/न्यूनतम तत्व पुनः प्राप्ति विधियों के साथ एकीकरण (टिप्पणी 3)
स्वचालित ब्लॉक पैरामीटर $s$ सेटिंग रणनीति (टिप्पणी 2)

संभावित विस्तार दिशाएं:

सैद्धांतिक अभिसरण और त्रुटि सीमा विश्लेषण
समानांतर कार्यान्वयन दक्षता बढ़ाने के लिए
स्वचालित बाधा प्रबंधन रणनीति
अन्य टेंसर प्रारूपों के लिए गहन सत्यापन

गहन मूल्यांकन

शक्तियां

समस्या मॉडलिंग नवाचार:
- पहली बार स्पष्ट रूप से eigenvector टेंसर की रैंक-एक संरचना का उपयोग
- अनुकूलन समस्या स्केल $\prod_p n_p$ से $\sum_p n_p k$ तक कम हो गया है
- गणितीय व्युत्पत्ति कठोर है (प्रमेय 1 और प्रमेय 2)
एल्गोरिदम डिजाइन चतुर:
- ब्लॉक विघटन रणनीति दक्षता और सटीकता को प्रभावी रूप से संतुलित करती है
- वियोज्य योग संरचना का उपयोग प्राकृतिक और कुशल है
- बाधा प्रबंधन $\beta$ गुणांक के माध्यम से घातीय जटिलता से बचा जाता है
व्यापक प्रयोगात्मक डिजाइन:
- तीन डेटासेट प्रकार: सिंथेटिक, फ़ंक्शन-उत्पन्न, वास्तविक अनुप्रयोग
- बहु-आयामी तुलना: सटीकता, मान, स्थिरता
- कई परिदृश्य: $k=1$ और $k=5$ , अधिकतम और न्यूनतम तत्व, जटिल टेंसर
- पर्याप्त पैरामीटर विश्लेषण ( $s$ और $K$ )
उच्च व्यावहारिक मूल्य:
- क्वांटम सर्किट सिमुलेशन में वास्तविक प्रभाव प्रदर्शित
- सटीकता में उल्लेखनीय सुधार (अधिकतम 372.7%)
- कार्यान्वयन सरल, पुनरुत्पादन में आसान
स्पष्ट लेखन:
- संरचना तार्किक, तर्क स्पष्ट
- समृद्ध चार्ट (9 चित्र, 2 तालिकाएं)
- कार्यप्रवाह आरेख (चित्र 2) एल्गोरिदम को सहज रूप से प्रदर्शित करता है

कमियां

सैद्धांतिक अपर्याप्तता:
- अभिसरण प्रमाण की कमी
- कोई त्रुटि सीमा या सन्निकटन गारंटी नहीं
- अनुमानी विधि का सैद्धांतिक आधार कमजोर है
कम्प्यूटेशनल दक्षता विश्लेषण अपर्याप्त:
- वास्तविक रन टाइम रिपोर्ट नहीं किया गया है
- आधार विधियों के साथ दक्षता तुलना की कमी
- मेमोरी ओवरहेड का वास्तविक माप प्रदान नहीं किया गया है
प्रयोगात्मक सीमाएं:
- यादृच्छिक टेंसर प्रयोग केवल 100 नमूने, सांख्यिकीय महत्व परीक्षण की कमी
- अति-बड़ी समस्याओं का परीक्षण नहीं किया गया ( $d>10$ , $n_p>1024$ )
- क्वांटम सर्किट प्रयोग मेमोरी सीमा से प्रभावित, 36 और 49 क्वांटम बिट वास्तविक सटीकता सत्यापित नहीं की जा सकी
विधि सीमाएं:
- चरम वितरण ( $U(-1,1)$ ) के लिए सटीकता अभी भी कम है (~60%)
- पैरामीटर $s$ और $K$ को मैनुअल रूप से समायोजित करने की आवश्यकता है, स्वचालित रणनीति की कमी
- उप-समस्या समाधान पूर्ण टेंसर पुनः प्राप्ति पर निर्भर करता है, स्केलेबिलिटी को सीमित करता है
तुलना अधूरी:
- नवीनतम टेंसर अनुकूलन विधियों के साथ तुलना नहीं (जैसे TTOpt, PROTES)
- गहन शिक्षा विधियों के साथ तुलना की कमी
- MinCPD केवल $k=1$ का समर्थन करता है, तुलना पूरी तरह से निष्पक्ष नहीं है
कोड सार्वजनिक नहीं:
- पुनरुत्पादन क्षमता और व्यावहारिक अनुप्रयोग को प्रभावित करता है

प्रभाव

क्षेत्र में योगदान:

टेंसर शीर्ष- $k$ पुनः प्राप्ति के लिए नई सतत अनुकूलन दृष्टिकोण प्रदान करता है
ब्लॉक-वैकल्पिक पुनरावृत्ति ढांचा अन्य टेंसर समस्या समाधान को प्रेरित कर सकता है
क्वांटम कम्प्यूटिंग क्षेत्र में सीधे अनुप्रयोग मूल्य है

व्यावहारिक मूल्य:

सटीकता और स्थिरता में उल्लेखनीय सुधार
अनुशंसा प्रणाली, क्वांटम सिमुलेशन आदि कई क्षेत्रों में लागू किया जा सकता है
एल्गोरिदम अपेक्षाकृत सरल, कार्यान्वयन में आसान

पुनरुत्पादन क्षमता:

एल्गोरिदम विवरण विस्तृत (एल्गोरिदम 1)
प्रयोगात्मक सेटअप स्पष्ट
लेकिन कोड सार्वजनिक नहीं, स्वयं कार्यान्वयन की आवश्यकता है

अपेक्षित प्रभाव:

अल्पकालिक: टेंसर पुनः प्राप्ति कार्यों के लिए नया उपकरण प्रदान करता है
दीर्घकालिक: टेंसर अनुकूलन एल्गोरिदम डिजाइन प्रतिमान को प्रभावित कर सकता है
उद्धरण संभावना: मध्यम (संख्यात्मक विश्लेषण और टेंसर कम्प्यूटिंग क्षेत्र)

लागू परिदृश्य

सबसे उपयुक्त परिदृश्य:

मध्यम-स्केल CP टेंसर ( $d \leq 10$ , $n_p \leq 1000$ , $R \leq 100$ )
अपेक्षाकृत समान डेटा वितरण (जैसे $U(0,1)$ )
उच्च सटीकता और स्थिरता की आवश्यकता वाले अनुप्रयोग
क्वांटम सर्किट सिमुलेशन का माप चरण
छोटे $k$ मान ( $k \leq 10$ ) के साथ पुनः प्राप्ति कार्य

कम उपयुक्त परिदृश्य:

अति-बड़े टेंसर (मेमोरी सीमा)
चरम डेटा वितरण (जैसे अत्यधिक असंतुलित)
उच्च वास्तविक-समय आवश्यकता वाले अनुप्रयोग (उप-समस्या समाधान धीमा)
बहुत बड़े $k$ मान (टेंसर तत्वों की कुल संख्या के करीब)

अनुशंसित रणनीति:

पहले $s=2, K=1$ के साथ प्रयास करें
यदि सटीकता अपर्याप्त है, $K$ को 5 तक बढ़ाएं
यदि मेमोरी अनुमति देता है, $s=3$ आजमा सकते हैं
पुनरुत्पादन क्षमता बढ़ाने के लिए नमूनाकरण विधियों के साथ संयुक्त उपयोग करें

संदर्भ (चयनित)

Espig et al. (2013, 2020): सममित eigenvalue मॉडल की आधारशिला कार्य
Lu et al. (2017): Star sampling विधि
Sidiropoulos et al. (2023): MinCPD प्रक्षेपित ढाल वंश विधि
Oseledets (2011): टेंसर चेन (TT) विघटन
Kolda & Bader (2009): टेंसर विघटन सर्वेक्षण
Ma & Yang (2022): क्वांटम सिमुलेशन में निम्न-रैंक सन्निकटन

समग्र मूल्यांकन: यह एक ठोस संख्यात्मक विश्लेषण पेपर है, जो टेंसर शीर्ष- $k$ पुनः प्राप्ति की इस महत्वपूर्ण समस्या के लिए नवीन मॉडलिंग और एल्गोरिदम प्रस्तावित करता है। प्रयोगात्मक सत्यापन पर्याप्त है, व्यावहारिक मूल्य अधिक है। मुख्य कमियां सैद्धांतिक विश्लेषण की कमी और कम्प्यूटेशनल दक्षता मूल्यांकन की अपर्याप्तता में हैं। टेंसर कम्प्यूटिंग और क्वांटम सिमुलेशन क्षेत्र के शोधकर्ताओं और इंजीनियरों के लिए, यह एक ध्यान देने योग्य कार्य है। सुझाव है कि लेखक बाद में सैद्धांतिक विश्लेषण जोड़ें, कोड सार्वजनिक करें, और बड़ी समस्याओं पर आगे सत्यापन करें।

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

गुणनखंडित टेंसर से शीर्ष-kkk तत्वों को पुनः प्राप्त करने के लिए एक नवीन ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम

गुणनखंडित टेंसर से शीर्ष- $k$ तत्वों को पुनः प्राप्त करने के लिए एक नवीन ब्लॉक-वैकल्पिक पुनरावृत्तिमूलक एल्गोरिदम