2025-11-29T09:13:18.768533

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

Xiao, Zeng

Tensors, especially higher-order tensors, are typically represented in low-rank formats to preserve the main information of the high-dimensional data while saving memory space. In practice, only a small fraction elements in high-dimensional data are of interest, such as the $k$ largest or smallest elements. Thus, retrieving the $k$ largest/smallest elements from a low-rank tensor is a fundamental and important task in a wide variety of applications. In this paper, we first model the top-$k$ elements retrieval problem to a continuous constrained optimization problem. To address the equivalent optimization problem, we develop a block-alternating iterative algorithm that decomposes the original problem into a sequence of small-scale subproblems. Leveraging the separable summation structure of the objective function, a heuristic algorithm is proposed to solve these subproblems in an alternating manner. Numerical experiments with tensors from synthetic and real-world applications demonstrate that the proposed algorithm outperforms existing methods in terms of accuracy and stability.

academic

Un Nuovo Algoritmo Iterativo Block-Alternating per il Recupero dei Top- $k$ Elementi da Tensori Fattorizzati

Informazioni Fondamentali

ID Articolo: 2511.07898
Titolo: A Novel Block-Alternating Iterative Algorithm for Retrieving Top- $k$ Elements from Factorized Tensors
Autori: Chuanfu Xiao, Jiaxin Zeng (Scuola di Matematica e Scienze Computazionali, Università di Xiangtan; Dipartimento di Comunicazioni a Banda Larga, Laboratorio Pengcheng)
Classificazione: math.NA (Analisi Numerica), cs.NA (Analisi Numerica Computazionale)
Data di Pubblicazione: 11 novembre 2025 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2511.07898v1

Riassunto

I tensori di ordine elevato sono comunemente rappresentati in formato a basso rango per conservare la memoria mantenendo le informazioni principali dei dati ad alta dimensionalità. Nelle applicazioni pratiche, spesso si è interessati solo a una piccola frazione di elementi, come i $k$ elementi massimi o minimi. Questo articolo affronta il problema fondamentale del recupero dei top- $k$ elementi da tensori a basso rango, modellando innanzitutto il problema come un'ottimizzazione vincolata continua, quindi sviluppando un algoritmo iterativo block-alternating che decompone il problema originale in una serie di sottoproblemi di piccole dimensioni. Sfruttando la struttura di somma separabile della funzione obiettivo, viene proposto un algoritmo euristico per risolvere questi sottoproblemi in modo alternato. Gli esperimenti numerici su dati sintetici e tensori da applicazioni reali dimostrano che l'algoritmo supera i metodi esistenti in termini di accuratezza e stabilità.

Contesto di Ricerca e Motivazione

1. Problema da Risolvere

Recuperare in modo efficiente e accurato i top- $k$ elementi massimi o minimi e le loro posizioni da tensori fattorizzati (factorized tensor). I tensori fattorizzati si riferiscono a dati ad alta dimensionalità rappresentati in formati di decomposizione a basso rango come CP, Tucker, TT, ecc.

2. Importanza del Problema

Sistemi di Raccomandazione: I $k$ elementi massimi corrispondono alle raccomandazioni personalizzate più significative
Simulazione Quantistica: Gli stati quantici sono tipicamente rappresentati mediante decomposizione tensoriale per ridurre l'uso di memoria; la stima di massima verosimiglianza equivale al recupero degli elementi di ampiezza massima da tensori fattorizzati
Calcolo Scientifico: Estrazione di informazioni critiche da dati ad alta dimensionalità come dati di simulazione, immagini iperspettrali e video
Problemi di Ottimizzazione: Molti compiti pratici possono essere modellati come problemi di recupero dei top- $k$ elementi

3. Limitazioni dei Metodi Esistenti

Metodi di Campionamento (come star sampling):

L'accuratezza dipende fortemente dalla dimensione e dalla qualità del campione
Prestazioni instabili, influenzate dalla struttura sottostante del tensore fattorizzato
Applicabili solo per $k>1$ , non generalizzabili direttamente al recupero di elementi minimi

Metodi di Ottimizzazione Continua:

Iterazione di Potenza/Iterazione Inversa: Il prodotto di Hadamard causa una rapida crescita del rango tensoriale, richiedendo operazioni di ricompressione; gli errori accumulati possono portare a fallimenti di localizzazione
Discesa Gradiente Proiettata (PGD): Altamente sensibile alla scelta di iperparametri (come la dimensione del passo), prestazioni instabili su diversi compiti
Gli algoritmi esistenti non possono essere applicati direttamente al caso $k>1$

4. Motivazione della Ricerca

Basandosi sul modello di autovalori simmetrici (Espig et al. 2013, 2020), gli autori osservano che i tensori corrispondenti agli autovettori hanno una struttura di rango uno, da cui propongono una nuova ricostruzione di ottimizzazione vincolata continua equivalente e progettano un algoritmo iterativo block-alternating per risolverla efficientemente.

Contributi Principali

Contributo di Modellazione: Basato sulla struttura di rango uno dei tensori corrispondenti agli autovettori, il problema di recupero dei top- $k$ elementi viene modellato come un problema di ottimizzazione vincolata continua (Teorema 1)
Contributo Algoritmico: Viene proposto un nuovo algoritmo iterativo block-alternating per risolvere il problema di ottimizzazione equivalente, con un metodo euristico progettato sfruttando la struttura di somma separabile della funzione obiettivo
Contributo Applicativo: L'algoritmo viene applicato alla fase di misurazione della simulazione di circuiti quantici, con risultati numerici che dimostrano superiorità rispetto agli algoritmi esistenti
Vantaggi di Prestazione:
- Universalità: Può recuperare i $k$ elementi massimi/minimi e le loro posizioni
- Stabilità: Accuratezza significativamente migliorata su tensori fattorizzati con distribuzioni diverse

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Tensore CP di ordine $d$ $\mathcal{A} \in \mathbb{R}^{n_1 \times n_2 \times \cdots \times n_d}$ , rappresentato come: $\mathcal{A} := \sum_{r=1}^{R} \mathbf{U}_1(:,r) \circ \mathbf{U}_2(:,r) \circ \cdots \circ \mathbf{U}_d(:,r)$ dove $\circ$ denota il prodotto esterno tensoriale, $\{\mathbf{U}_p \in \mathbb{R}^{n_p \times R}: p=1,\ldots,d\}$ sono i fattori CP, e $R$ è il rango CP.

Output: I valori dei $k$ elementi massimi (o minimi) e le corrispondenti posizioni di indici multidimensionali.

Obiettivo: Recuperare efficientemente direttamente dalla rappresentazione fattorizzata senza ricostruire completamente il tensore.

Architettura del Modello

Primo Passo: Modellazione del Problema (Teorema 1)

Il problema di recupero dei top- $k$ viene trasformato in un problema di autovalori simmetrici. L'osservazione chiave è che gli autovettori della matrice diagonale $\mathbf{A}$ (costituita da tutti gli elementi del tensore) hanno una struttura di rango uno.

Problema di Ottimizzazione 2.5 (Modellazione Centrale): $\max_{\mathbf{X}_p \in \mathbb{R}^{n_p \times k}} \sum_{j=1}^{k} \sum_{r=1}^{R} \prod_{p=1}^{d} \langle \mathbf{X}_p(:,j), \mathbf{U}_p(:,r) * \mathbf{X}_p(:,j) \rangle$

Vincoli:

$\|\mathbf{X}_p(:,j)\|_2 = 1$ per tutti $p=1,\ldots,d; j=1,\ldots,k$
$\prod_{p=1}^{d} \langle \mathbf{X}_p(:,i), \mathbf{X}_p(:,j) \rangle = \begin{cases} 1, & i=j \\ 0, & i \neq j \end{cases}$

dove $*$ denota il prodotto di Hadamard e $\langle \cdot, \cdot \rangle$ denota il prodotto interno.

Analisi della Scala: La dimensione del problema è $\sum_{p=1}^{d} n_p k$ , e il calcolo della funzione obiettivo coinvolge solo prodotti di Hadamard di vettori $n_p$ -dimensionali, evitando la ricostruzione del tensore completo.

Secondo Passo: Algoritmo Iterativo Block-Alternating (Algoritmo 1)

Idea Centrale: Ispirato dall'iterazione di Gauss-Seidel non lineare, ad ogni iterazione vengono aggiornate solo $s$ variabili obiettivo $\{\mathbf{X}_{p_1}, \ldots, \mathbf{X}_{p_s}\}$ , decomponendo il problema su larga scala in sottoproblemi di piccole dimensioni.

Forma del Sottoproblema (Teorema 2): $\max_{\{\mathbf{X}_q: q \in \{p_1,\ldots,p_s\}\}} \sum_{j,r=1}^{k,R} \alpha_r^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q(:,j) \rangle$

dove i coefficienti sono: $\alpha_{r,j}^t = \prod_{q \notin \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q^t(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q^t(:,j) \rangle$

La dimensione del sottoproblema si riduce a $\sum_{q \in \{p_1,\ldots,p_s\}} n_q k$ .

Terzo Passo: Metodo di Risoluzione Euristico

Osservazione Chiave: La funzione obiettivo ha una struttura di somma separabile: $f_1(\mathbf{X}_{p_1}(:,1), \ldots, \mathbf{X}_{p_s}(:,1)) + \cdots + f_k(\mathbf{X}_{p_1}(:,k), \ldots, \mathbf{X}_{p_s}(:,k))$

Strategia di Risoluzione: Le soluzioni vengono determinate sequenzialmente nell'ordine $1 \to 2 \to \cdots \to k$ , soddisfacendo l'ottimalità locale.

Per $j=1$ : $(\mathbf{X}_{p_1}^*(:,1), \ldots, \mathbf{X}_{p_s}^*(:,1)) = \arg\max f_1$ è equivalente al recupero dell'elemento massimo del tensore CP di ordine $s$ $\sum_{r=1}^{R} \alpha_{r,1}^t \mathbf{U}_{p_1}(:,r) \circ \cdots \circ \mathbf{U}_{p_s}(:,r)$ .

Per $j>1$ : deve essere soddisfatto il vincolo $\beta_{r,i,j}^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,i), \mathbf{X}_q(:,j) \rangle = 0$ (per tutti $i<j$ ).

Due Casi:

Se $\beta_{r,i,j}^t = 0$ : il vincolo è inattivo, si recupera direttamente l'elemento massimo
Altrimenti: si trova l'elemento massimo che soddisfa la condizione di ortogonalità

Punti di Innovazione Tecnica

Sfruttamento della Struttura di Rango Uno: Utilizzo esplicito della struttura di rango uno dei tensori corrispondenti agli autovettori per semplificare il problema di ottimizzazione, evitando il trattamento diretto del tensore ad alta dimensionalità
Strategia di Decomposizione Block: Controllo della dimensione del sottoproblema e dello spazio di ricerca attraverso il parametro block $s$ , bilanciando efficienza e accuratezza
Sfruttamento della Somma Separabile: Utilizzo intelligente della separabilità della funzione obiettivo, trasformando l'ottimizzazione congiunta di $k$ soluzioni in ottimizzazione sequenziale
Gestione dei Vincoli: Giudizio efficiente della validità dei vincoli attraverso il coefficiente $\beta_{r,i,j}^t$ , evitando complessità esponenziale
Progettazione Universale:
- Il recupero di elementi massimi/minimi richiede solo il cambio della direzione di ottimizzazione
- Supporta il recupero di parti reali/immaginarie di tensori complessi
- Applicabile ad altri formati tensoriali come Tucker, TT, ecc.

Configurazione Sperimentale

Dataset

1. Dati Sintetici (Esperimento 4.1)

Tensori CP Casuali: 100 tensori CP generati casualmente
Impostazioni dei Parametri:
- Ordine $d \in [3, 10]$ (intero casuale)
- Dimensione $n_p \in [2, 15-d]$ (intero casuale)
- Rango CP $R \in [2, 10]$ (intero casuale)
Tipi di Distribuzione: I fattori CP seguono distribuzioni uniformi $U(-1,1)$ , $U(0,0.75)$ , $U(0,1)$

2. Tensori CP Generati da Funzioni Multivariabili (Esperimento 4.2)

Funzione Griewank: $f(\mathbf{z}) = \sum_{p=1}^{d} \frac{z_p^2}{4000} - \prod_{p=1}^{d} \cos(\frac{z_p}{\sqrt{p}}) + 1$ , $z_p \in [-600, 600]$
Funzione Schwefel: $f(\mathbf{z}) = 418.9829d - \sum_{p=1}^{d} z_p \sin(\sqrt{|z_p|})$ , $z_p \in [-500, 500]$
Dimensione: $d=10$
Dimensione della Griglia: Per ogni dimensione $n \in \{128, 256, 512, 1024\}$

3. Simulazione di Circuiti Quantici (Esperimento 4.3)

Circuito Trasformata di Fourier Quantistica (QFT)
Numero di Qubit: $d \in \{9, 16, 25, 36, 49\}$ ( $d=l^2$ , $l \in \{3,4,5,6,7\}$ )
Modello CP di Sottospazio: Lo stato quantico viene riorganizzato come tensore di ordine $p$ ( $d=pq$ , $p=q=l$ )
Stato Iniziale: Tensore di rango uno generato casualmente, gli elementi dei fattori CP sono numeri complessi con parte reale e immaginaria che seguono $U(0,1)$

Metriche di Valutazione

Accuratezza (Accuracy): $\text{Accuracy} = \frac{\#\text{hit}}{S}$ dove $\#\text{hit}$ è il numero di volte in cui l'elemento massimo/minimo è stato identificato con successo, $S=100$ è il numero di tensori di test
Valore dell'Elemento (Value): Il valore dei top- $k$ elementi recuperati o la loro somma, utilizzato per valutare la vicinanza al valore reale
Stabilità: Visualizzazione della distribuzione dei valori e dei punti anomali sotto diverse distribuzioni mediante diagrammi a scatola

Metodi di Confronto

Power Iteration (Espig et al. 2020):
- Metodo di iterazione di potenza, con ricompressione introdotta quando il rango CP supera 10
- Applicazione di trasformazione di traslazione per rendere il tensore non negativo
- Determinazione della posizione dell'elemento massimo attraverso approssimazione di rango uno
Star Sampling (Lu et al. 2017):
- Metodo di campionamento, numero di nodi=2, numero di campioni= $\min(10^4, \lfloor 20\% \times \#P(\mathcal{A}) \rfloor)$
- Varianti: Star Sampling+1, Star Sampling+5 (espansione dello spazio di ricerca)
MinCPD via Frank-Wolfe (Sidiropoulos et al. 2023):
- Metodo di discesa gradiente proiettata
- Applicabile solo al caso $k=1$

Dettagli di Implementazione

Ambiente di Programmazione: Python + libreria TensorLy (backend NumPy)
Piattaforma Hardware: Computer portatile
Parametri dell'Algoritmo Proposto:
- Parametro block $s \in \{1, 2\}$
- Parametro di espansione $K \in \{1, 5\}$
- Notazione: Ours( $s$ )+ $K$ indica parametro block $s$ e spazio di ricerca espanso a $k+K$

Risultati Sperimentali

Risultati Principali

Esperimento 4.1: Tensori CP Casuali ( $k=1$ , Recupero dell'Elemento Massimo)

Confronto di Accuratezza (Figura 3d):

Distribuzione $U(-1,1)$ :
- Power Iteration: ~25%, Star Sampling: ~15%, MinCPD: ~11%
- Ours(1)+1: ~52% (miglioramento del 108.0%, 246.7%, 372.7%)
Distribuzione $U(0,0.75)$ :
- Power Iteration: ~68%, Star Sampling: ~42%, MinCPD: ~52%
- Ours(1)+1: ~79% (miglioramento del 16.2%, 88.1%, 51.9%)
Distribuzione $U(0,1)$ :
- Power Iteration: ~62%, Star Sampling: ~28%, MinCPD: ~53%
- Ours(1)+1: ~60% (stabilità ottimale)

Scoperte Chiave:

Star Sampling nella distribuzione $U(-1,1)$ ha valori lontani dal valore reale (Figura 3a)
MinCPD è sensibile alla scala numerica
L'algoritmo proposto mantiene stabilità su tutte le distribuzioni, con accuratezza superiore al 50%

Esperimento 4.1: Tensori CP Casuali ( $k=1$ , Recupero dell'Elemento Minimo)

Confronto di Accuratezza (Figura 4d):

MinCPD ha accuratezza ≤40% su tutte le distribuzioni
Ours(1)+1 raggiunge 48.0%~93.0%
Ours(2)+5 migliora ulteriormente l'accuratezza

Confronto dei Valori (Figura 4a): I valori ottenuti dall'algoritmo proposto sono generalmente più piccoli (più vicini al valore minimo reale)

Esperimento 4.1: Tensori CP Casuali ( $k=5$ , Recupero dell'Elemento Massimo)

Confronto di Accuratezza (Figura 5d):

Star Sampling: <45% (tutte le distribuzioni)
Ours(1)+1: 59.0% ( $U(-1,1)$ ), 84.0% ( $U(0,0.75)$ ), 82.0% ( $U(0,1)$ )
Ours(2)+5: raggiunge fino a 87.8%

Confronto dei Valori (Figura 5a): Star Sampling nella distribuzione $U(-1,1)$ ha somma <0 (deviazione grave)

Esperimento 4.1: Tensori CP Casuali ( $k=5$ , Recupero dell'Elemento Minimo)

Accuratezza (Figura 6d):

Ours(1)+1: 55.2%~87.8%
Ours(2)+5: ulteriore miglioramento, fino a 87.8%

Impatto dei Parametri:

Aumento del parametro block $s$ : espande lo spazio di ricerca, migliora l'accuratezza
Aumento del parametro di espansione $K$ : miglioramento significativo per la distribuzione $U(-1,1)$ (miglioramento del 21.0%~188.9%)

Esperimento 4.2: Tensori CP Generati da Funzioni Multivariabili (Recupero dell'Elemento Minimo)

Confronto del Valore Minimo Medio (Tabella 1):

Funzione Griewank:
- $n=128$ : MinCPD=22.87, Ours(2)=8.79 (minore di 14.08)
- $n=1024$ : MinCPD=1.82, Ours(2)=1.68 (minore di 0.14)
Funzione Schwefel:
- $n=128$ : MinCPD=507.44, Ours(2)=212.00 (minore di 295.44)
- $n=1024$ : MinCPD=178.04, Ours(2)=36.25 (minore di 141.79)

Stabilità (Figura 7): MinCPD ha più punti anomali, l'algoritmo proposto è più stabile

Esperimento 4.3: Simulazione di Circuiti Quantici

Accuratezza (Figura 9):

9 Qubit (Rango CP=8): Ours(2)+5 raggiunge il 100% ( $k=5$ )
16 Qubit (Rango CP=20): Ours(2)+5 raggiunge il 90.6%
25 Qubit (Rango CP=56): Ours(2)+5 raggiunge il 90.2%
L'accuratezza dei metodi di base diminuisce con l'aumento del numero di qubit, mentre l'algoritmo proposto rimane stabile

Confronto dei Valori (Tabella 2, $k=5$ ):

49 Qubit:
- Power Iteration: $1.19 \times 10^{-12}$ (fallimento grave)
- Star Sampling+5: $2.22 \times 10^{-7}$
- Ours(2)+5: $9.97 \times 10^{-7}$ (massimo)

Scoperte Chiave:

Power Iteration fallisce su problemi su larga scala (errore dominante)
L'algoritmo proposto ottiene il valore massimo nei casi di 36 e 49 qubit (memoria insufficiente per verificare il valore reale)
La stabilità non diminuisce con la scala del problema

Esperimenti di Ablazione

Sebbene l'articolo non etichetti esplicitamente gli esperimenti di ablazione, i contributi dei componenti vengono dimostrati attraverso variazioni di parametri:

Impatto del Parametro Block $s$ :
- $s=1 \to s=2$ : miglioramento dell'accuratezza, specialmente nella distribuzione $U(-1,1)$
- Costo: aumento dell'overhead computazionale e di memoria
Impatto del Parametro di Espansione $K$ :
- $K=1 \to K=5$ : miglioramento significativo dell'accuratezza per distribuzioni difficili ( $U(-1,1)$ )
- Miglioramento limitato per distribuzioni semplici ( $U(0,1)$ )

Analisi di Casi

L'articolo dimostra attraverso visualizzazioni (Figure 3-7, Figura 9):

Diagrammi a scatola che mostrano la distribuzione dei valori e la stabilità
Istogrammi di accuratezza per il confronto tra diversi metodi
Risultati di esperimenti su circuiti quantici che dimostrano l'effetto pratico

Scoperte Sperimentali

Sensibilità alla Distribuzione dei Dati: Tutti i metodi sono sensibili alla distribuzione dei dati, ma l'algoritmo proposto è relativamente il più stabile
Robustezza alla Scala: I metodi di base mostrano degradazione delle prestazioni su problemi su larga scala, mentre l'algoritmo proposto rimane stabile
Verifica dell'Universalità: Applicazione riuscita al recupero di elementi massimi/minimi, diversi valori di $k$ , tensori complessi
Importanza dell'Ottimizzazione dei Parametri: L'impostazione ragionevole di $s$ e $K$ è critica per l'accuratezza

Lavori Correlati

1. Rappresentazione di Decomposizione Tensoriale

Decomposizione CP (Hitchcock 1927), Decomposizione Tucker (Tucker 1966), Tensor Train (TT) (Oseledets 2011)
Applicazioni: Calcolo scientifico, telerilevamento, visione artificiale, sistemi di raccomandazione

2. Metodi di Recupero dei Top- $k$ Elementi

Metodi di Campionamento:

Diamond sampling (Ballard et al. 2015, matrici)
Star sampling (Lu et al. 2017, tensori CP)
Altri metodi di campionamento per formati (Sozykin et al. 2022; Chertkov et al. 2023; Ryzhakov et al. 2024)

Metodi di Ottimizzazione Continua:

Problema di autovalori simmetrici (Espig et al. 2013, 2020)
Iterazione di potenza/iterazione inversa (Espig et al. 2020; Soley et al. 2021)
Discesa gradiente proiettata (Sidiropoulos et al. 2023)

3. Campi di Applicazione

Sistemi di Raccomandazione (Symeonidis 2016; Frolov & Oseledets 2017)
Simulazione Quantistica (Zhou et al. 2020; Yuan et al. 2021; Ma & Yang 2022)
Problemi di Ottimizzazione (Sozykin et al. 2022; Sidiropoulos et al. 2023)

Vantaggi di Questo Articolo

Primo utilizzo sistematico della struttura di rango uno nella modellazione
Primo metodo di ottimizzazione continua che supporta $k>1$
Universalità e stabilità significativamente superiori ai metodi esistenti

Conclusioni e Discussione

Conclusioni Principali

Viene proposta una modellazione di ottimizzazione vincolata continua basata sulla struttura di rango uno (Teorema 1)
Viene sviluppato un algoritmo iterativo block-alternating che decompone efficacemente i problemi su larga scala
Gli esperimenti numerici verificano la superiorità dell'algoritmo in molteplici scenari:
- Miglioramento dell'accuratezza: 16%~373% (rispetto ai metodi di base)
- Stabilità: robustezza su diverse distribuzioni di dati
- Universalità: supporto per massimi/minimi, diversi valori di $k$ , tensori complessi
Viene dimostrato il valore pratico nella simulazione di circuiti quantici

Limitazioni

Complessità Computazionale:
- La risoluzione dei sottoproblemi richiede la ricostruzione del tensore CP di ordine $s$ come tensore completo
- Complessità temporale: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q R + \prod_{q} n_q \log(\prod_q n_q)$
- Complessità di memoria: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q$
Sensibilità ai Parametri:
- Il parametro block $s$ deve essere regolato in base alla scala del problema
- Il valore ottimale del parametro di espansione $K$ dipende dalla distribuzione dei dati
Ottimalità Locale:
- Il metodo euristico non garantisce l'ottimalità globale
- La determinazione sequenziale delle soluzioni potrebbe perdere combinazioni più ottimali
Mancanza di Analisi Teorica:
- Nessuna prova di convergenza fornita
- Mancanza di analisi dei limiti di errore
Ambito di Applicabilità:
- Principalmente orientato al formato CP, sebbene generalizzabile a Tucker/TT ma non completamente verificato
- L'accuratezza su distribuzioni estreme (come $U(-1,1)$ ) ha ancora margini di miglioramento

Direzioni Future

Direzioni esplicitamente proposte nell'articolo:

Applicazione a più scenari pratici: sistemi di raccomandazione, misurazione di reti, biologia computazionale
Integrazione con metodi esistenti di recupero di elementi massimi/minimi (Nota 3)
Strategie di impostazione adattiva del parametro block $s$ (Nota 2)

Potenziali direzioni di estensione:

Analisi teorica di convergenza e limiti di errore
Implementazione parallela per migliorare l'efficienza
Strategie di gestione adattiva dei vincoli
Verifica approfondita su altri formati tensoriali

Valutazione Approfondita

Punti di Forza

Innovazione nella Modellazione del Problema:
- Primo utilizzo esplicito della struttura di rango uno dei tensori corrispondenti agli autovettori
- Riduzione della scala del problema di ottimizzazione da $\prod_p n_p$ a $\sum_p n_p k$
- Derivazione matematica rigorosa (Teoremi 1 e 2)
Progettazione Algoritmica Ingegnosa:
- La strategia di decomposizione block bilancia efficacemente efficienza e accuratezza
- L'utilizzo della struttura di somma separabile è naturale e efficiente
- La gestione dei vincoli attraverso il coefficiente $\beta$ evita complessità esponenziale
Progettazione Sperimentale Completa:
- Tre classi di dataset: sintetici, generati da funzioni, applicazioni reali
- Confronto multidimensionale: accuratezza, valore, stabilità
- Molteplici scenari: $k=1$ e $k=5$ , elementi massimi e minimi, tensori complessi
- Analisi parametrica sufficiente ( $s$ e $K$ )
Alto Valore Pratico:
- Dimostrazione di effetto pratico nella simulazione di circuiti quantici
- Miglioramento significativo dell'accuratezza (fino al 372.7%)
- Implementazione semplice, facile da riprodurre
Scrittura Chiara:
- Struttura ragionevole, logica chiara
- Figure ricche (9 figure, 2 tabelle)
- Diagramma di flusso di lavoro (Figura 2) che mostra intuitivamente l'algoritmo

Carenze

Insufficienza Teorica:
- Mancanza di prova di convergenza
- Nessun limite di errore o garanzia di approssimazione
- Fondamento teorico debole del metodo euristico
Analisi Insufficiente dell'Efficienza Computazionale:
- Nessun rapporto del tempo di esecuzione effettivo
- Mancanza di confronto di efficienza con i metodi di base
- Nessuna misurazione effettiva dell'overhead di memoria
Limitazioni Sperimentali:
- L'esperimento su tensori casuali ha solo 100 campioni, mancano test di significatività statistica
- Nessun test su problemi su scala molto grande (come $d>10$ , $n_p>1024$ )
- L'esperimento su circuiti quantici è limitato dalla memoria, senza verifica dell'accuratezza reale per 36 e 49 qubit
Limitazioni del Metodo:
- L'accuratezza su distribuzioni estreme ( $U(-1,1)$ ) è ancora relativamente bassa (~60%)
- I parametri $s$ e $K$ richiedono regolazione manuale, mancanza di strategie adattive
- La risoluzione dei sottoproblemi dipende dalla ricostruzione del tensore completo, limitando la scalabilità
Confronto Non Completo:
- Nessun confronto con metodi di ottimizzazione tensoriale più recenti (come TTOpt, PROTES)
- Mancanza di confronto con metodi di apprendimento profondo
- MinCPD supporta solo $k=1$ , il confronto non è completamente equo
Codice Non Pubblico: Influisce sulla riproducibilità e sull'applicazione pratica

Impatto

Contributi al Campo:

Fornisce una nuova prospettiva di ottimizzazione continua per il recupero tensoriale top- $k$
Il framework di iterazione block-alternating può ispirare la risoluzione di altri problemi tensoriali
Ha valore di applicazione diretta nel campo del calcolo quantico

Valore Pratico:

Miglioramento significativo di accuratezza e stabilità
Applicabile a sistemi di raccomandazione, simulazione quantistica e altri campi
L'algoritmo è relativamente semplice, facile da implementare

Riproducibilità:

Descrizione dettagliata dell'algoritmo (Algoritmo 1)
Impostazione sperimentale chiara
Ma il codice non è pubblico, richiede implementazione autonoma

Impatto Previsto:

Breve termine: fornisce nuovi strumenti per compiti di recupero tensoriale
Lungo termine: potrebbe influenzare il paradigma di progettazione degli algoritmi di ottimizzazione tensoriale
Potenziale di citazione: medio (campo dell'analisi numerica e calcolo tensoriale)

Scenari di Applicabilità

Scenari Più Adatti:

Tensori CP di Scala Media ( $d \leq 10$ , $n_p \leq 1000$ , $R \leq 100$ )
Distribuzione dei Dati Relativamente Uniforme (come $U(0,1)$ )
Applicazioni che Richiedono Alta Accuratezza e Stabilità
Fase di Misurazione della Simulazione di Circuiti Quantici
Compiti di Recupero con Valori di $k$ Piccoli ( $k \leq 10$ )

Scenari Meno Adatti:

Tensori su Scala Molto Grande (limitazioni di memoria)
Distribuzioni di Dati Estreme (come altamente squilibrate)
Applicazioni con Requisiti Elevati di Tempo Reale (risoluzione dei sottoproblemi relativamente lenta)
Valori di $k$ Molto Grandi (prossimi al numero totale di elementi del tensore)

Strategia Consigliata:

Provare prima con $s=2, K=1$
Se l'accuratezza è insufficiente, aumentare $K$ a 5
Se la memoria lo consente, provare $s=3$
Utilizzare in combinazione con metodi di campionamento per migliorare la robustezza

Riferimenti Bibliografici (Selezionati)

Espig et al. (2013, 2020): Lavoro fondamentale del modello di autovalori simmetrici
Lu et al. (2017): Metodo star sampling
Sidiropoulos et al. (2023): Metodo MinCPD di discesa gradiente proiettata
Oseledets (2011): Decomposizione tensor train (TT)
Kolda & Bader (2009): Rassegna sulla decomposizione tensoriale
Ma & Yang (2022): Approssimazione a basso rango nella simulazione quantistica

Valutazione Complessiva: Questo è un articolo solido di analisi numerica che affronta il problema importante del recupero dei top- $k$ elementi da tensori con modellazione e algoritmi innovativi. La verifica sperimentale è completa e il valore pratico è elevato. Le principali carenze risiedono nella mancanza di analisi teorica e nella valutazione insufficiente dell'efficienza computazionale. Per i ricercatori e gli ingegneri nei campi del calcolo tensoriale e della simulazione quantistica, questo è un lavoro degno di attenzione. Si consiglia agli autori di integrare in futuro l'analisi teorica, rendere pubblico il codice e verificare ulteriormente su problemi su scala più grande.

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

Un Nuovo Algoritmo Iterativo Block-Alternating per il Recupero dei Top-kkk Elementi da Tensori Fattorizzati

Un Nuovo Algoritmo Iterativo Block-Alternating per il Recupero dei Top- $k$ Elementi da Tensori Fattorizzati