2025-11-29T09:13:18.768533

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

Xiao, Zeng

Tensors, especially higher-order tensors, are typically represented in low-rank formats to preserve the main information of the high-dimensional data while saving memory space. In practice, only a small fraction elements in high-dimensional data are of interest, such as the $k$ largest or smallest elements. Thus, retrieving the $k$ largest/smallest elements from a low-rank tensor is a fundamental and important task in a wide variety of applications. In this paper, we first model the top-$k$ elements retrieval problem to a continuous constrained optimization problem. To address the equivalent optimization problem, we develop a block-alternating iterative algorithm that decomposes the original problem into a sequence of small-scale subproblems. Leveraging the separable summation structure of the objective function, a heuristic algorithm is proposed to solve these subproblems in an alternating manner. Numerical experiments with tensors from synthetic and real-world applications demonstrate that the proposed algorithm outperforms existing methods in terms of accuracy and stability.

academic

Un Algoritmo Iterativo Novedoso de Bloques Alternantes para Recuperar los Elementos Top- $k$ de Tensores Factorizados

Información Básica

ID del Artículo: 2511.07898
Título: A Novel Block-Alternating Iterative Algorithm for Retrieving Top- $k$ Elements from Factorized Tensors
Autores: Chuanfu Xiao, Jiaxin Zeng (Escuela de Matemáticas y Ciencias Computacionales, Universidad de Xiangtan; Departamento de Comunicaciones de Banda Ancha, Laboratorio Pengcheng)
Clasificación: math.NA (Análisis Numérico), cs.NA (Análisis Numérico Computacional)
Fecha de Publicación: 11 de noviembre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2511.07898v1

Resumen

Los tensores de orden superior se representan típicamente en formato de bajo rango para conservar la información principal de datos de alta dimensión mientras se ahorra memoria. En aplicaciones prácticas, frecuentemente solo se requiere acceder a una pequeña porción de elementos, tales como los $k$ elementos máximos o mínimos. Este artículo aborda el problema fundamental de recuperar elementos top- $k$ de tensores de bajo rango, modelándolo primero como un problema de optimización continua con restricciones, y luego desarrollando un algoritmo iterativo de bloques alternantes que descompone el problema original en una serie de subproblemas de menor escala. Aprovechando la estructura de suma separable de la función objetivo, se propone un algoritmo heurístico para resolver estos subproblemas de manera alternante. Los experimentos numéricos en datos sintéticos y tensores de aplicaciones reales demuestran que el algoritmo supera a los métodos existentes en precisión y estabilidad.

Contexto de Investigación y Motivación

1. Problema a Resolver

Recuperar de manera eficiente y precisa los $k$ elementos máximos o mínimos y sus ubicaciones de tensores factorizados (factorized tensors). Los tensores factorizados se refieren a datos de alta dimensión representados en formatos de descomposición de bajo rango como CP, Tucker, TT, etc.

2. Importancia del Problema

Sistemas de Recomendación: Los $k$ elementos máximos corresponden a las recomendaciones personalizadas más significativas
Simulación Cuántica: Los estados cuánticos se representan típicamente mediante descomposición de tensores para reducir el uso de memoria; la estimación de máxima verosimilitud es equivalente a recuperar elementos de amplitud máxima en tensores factorizados
Computación Científica: Extracción de información clave de datos de alta dimensión como datos simulados, imágenes hiperespectrales y vídeos
Problemas de Optimización: Muchas tareas prácticas pueden modelarse como problemas de recuperación de elementos top- $k$

3. Limitaciones de Métodos Existentes

Métodos de Muestreo (como star sampling):

La precisión depende altamente del tamaño y calidad de la muestra
El rendimiento es inestable, afectado por la estructura subyacente del tensor factorizado
Solo es aplicable para $k>1$ , no se generaliza directamente a la recuperación de elementos mínimos

Métodos de Optimización Continua:

Iteración de Potencia/Iteración Inversa: El producto de Hadamard causa un crecimiento rápido del rango del tensor, requiriendo operaciones de recompresión, y los errores acumulados pueden conducir a fallos en la localización
Descenso de Gradiente Proyectado (PGD): Altamente sensible a la selección de hiperparámetros (como el tamaño de paso), con rendimiento inestable en diferentes tareas
Los algoritmos existentes no pueden aplicarse directamente a casos con $k>1$

4. Motivación de la Investigación

Basándose en el modelo de valores propios simétricos (Espig et al. 2013, 2020), los autores observan que los tensores correspondientes a vectores propios tienen estructura de rango uno, lo que motiva una nueva reconstrucción de optimización continua equivalente con restricciones y el diseño de un algoritmo iterativo de bloques alternantes para resolverla eficientemente.

Contribuciones Principales

Contribución de Modelado: Basándose en la estructura de rango uno de los tensores correspondientes a vectores propios, se modela el problema de recuperación de elementos top- $k$ como un problema de optimización continua con restricciones (Teorema 1)
Contribución de Algoritmo: Se propone un algoritmo iterativo novedoso de bloques alternantes para resolver el problema de optimización equivalente, diseñando un método heurístico que aprovecha la estructura de suma separable de la función objetivo
Contribución de Aplicación: Se aplica el algoritmo a la fase de medición de simulación de circuitos cuánticos, con resultados numéricos que demuestran superioridad sobre algoritmos existentes
Ventajas de Rendimiento:
- Universalidad: Puede recuperar los $k$ elementos máximos/mínimos y sus ubicaciones
- Estabilidad: Mejora significativa en precisión en tensores factorizados con diferentes distribuciones

Explicación Detallada del Método

Definición de la Tarea

Entrada: Tensor CP de orden $d$ $\mathcal{A} \in \mathbb{R}^{n_1 \times n_2 \times \cdots \times n_d}$ , representado como: $\mathcal{A} := \sum_{r=1}^{R} \mathbf{U}_1(:,r) \circ \mathbf{U}_2(:,r) \circ \cdots \circ \mathbf{U}_d(:,r)$ donde $\circ$ denota el producto exterior de tensores, $\{\mathbf{U}_p \in \mathbb{R}^{n_p \times R}: p=1,\ldots,d\}$ son los factores CP, y $R$ es el rango CP.

Salida: Los valores de los $k$ elementos máximos (o mínimos) y sus correspondientes ubicaciones de índices multidimensionales.

Objetivo: Recuperar eficientemente directamente de la representación factorizada sin reconstruir completamente el tensor.

Arquitectura del Modelo

Paso Uno: Modelado del Problema (Teorema 1)

Se transforma el problema de recuperación top- $k$ en un problema de valores propios simétricos. La observación clave es que los vectores propios de la matriz diagonal $\mathbf{A}$ (constituida por todos los elementos del tensor) tienen estructura de rango uno.

Problema de Optimización 2.5 (Modelado Principal): $\max_{\mathbf{X}_p \in \mathbb{R}^{n_p \times k}} \sum_{j=1}^{k} \sum_{r=1}^{R} \prod_{p=1}^{d} \langle \mathbf{X}_p(:,j), \mathbf{U}_p(:,r) * \mathbf{X}_p(:,j) \rangle$

Restricciones:

$\|\mathbf{X}_p(:,j)\|_2 = 1$ para todo $p=1,\ldots,d; j=1,\ldots,k$
$\prod_{p=1}^{d} \langle \mathbf{X}_p(:,i), \mathbf{X}_p(:,j) \rangle = \begin{cases} 1, & i=j \\ 0, & i \neq j \end{cases}$

donde $*$ denota el producto de Hadamard y $\langle \cdot, \cdot \rangle$ denota el producto interior.

Análisis de Escala: La escala del problema es $\sum_{p=1}^{d} n_p k$ , y el cálculo de la función objetivo solo involucra productos de Hadamard de vectores de dimensión $n_p$ , evitando la reconstrucción completa del tensor.

Paso Dos: Algoritmo Iterativo de Bloques Alternantes (Algoritmo 1)

Idea Principal: Inspirado en la iteración de Gauss-Seidel no lineal, se actualizan solo $s$ variables objetivo $\{\mathbf{X}_{p_1}, \ldots, \mathbf{X}_{p_s}\}$ en cada iteración, descomponiendo el problema de gran escala en subproblemas de menor escala.

Forma del Subproblema (Teorema 2): $\max_{\{\mathbf{X}_q: q \in \{p_1,\ldots,p_s\}\}} \sum_{j,r=1}^{k,R} \alpha_r^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q(:,j) \rangle$

donde los coeficientes son: $\alpha_{r,j}^t = \prod_{q \notin \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q^t(:,j), \mathbf{U}_q(:,r) * \mathbf{X}_q^t(:,j) \rangle$

La escala del subproblema se reduce a $\sum_{q \in \{p_1,\ldots,p_s\}} n_q k$ .

Paso Tres: Método de Resolución Heurística

Observación Clave: La función objetivo tiene estructura de suma separable: $f_1(\mathbf{X}_{p_1}(:,1), \ldots, \mathbf{X}_{p_s}(:,1)) + \cdots + f_k(\mathbf{X}_{p_1}(:,k), \ldots, \mathbf{X}_{p_s}(:,k))$

Estrategia de Resolución: Se determina la solución secuencialmente en el orden $1 \to 2 \to \cdots \to k$ , satisfaciendo optimalidad local.

Para $j=1$ : $(\mathbf{X}_{p_1}^*(:,1), \ldots, \mathbf{X}_{p_s}^*(:,1)) = \arg\max f_1$ es equivalente a recuperar el elemento máximo del tensor CP de orden $s$ $\sum_{r=1}^{R} \alpha_{r,1}^t \mathbf{U}_{p_1}(:,r) \circ \cdots \circ \mathbf{U}_{p_s}(:,r)$ .

Para $j>1$ : Se debe satisfacer la restricción $\beta_{r,i,j}^t \prod_{q \in \{p_1,\ldots,p_s\}} \langle \mathbf{X}_q(:,i), \mathbf{X}_q(:,j) \rangle = 0$ (para todo $i<j$ ).

Dos Casos:

Si $\beta_{r,i,j}^t = 0$ : La restricción es inefectiva, se recupera directamente el elemento máximo
En caso contrario: Se encuentra el elemento máximo que satisface la condición de ortogonalidad

Puntos de Innovación Técnica

Utilización de Estructura de Rango Uno: Primera utilización explícita de la estructura de rango uno de los tensores correspondientes a vectores propios para simplificar el problema de optimización, evitando el manejo directo de tensores de alta dimensión
Estrategia de Descomposición en Bloques: Control de la escala del subproblema y el tamaño del espacio de búsqueda mediante el parámetro de bloque $s$ , equilibrando eficiencia y precisión
Utilización de Suma Separable: Aprovechamiento ingenioso de la separabilidad de la función objetivo, transformando la optimización conjunta de $k$ soluciones en optimización secuencial
Manejo de Restricciones: Determinación eficiente de la validez de restricciones mediante el coeficiente $\beta_{r,i,j}^t$ , evitando complejidad exponencial
Diseño Universal:
- La recuperación de elementos máximos/mínimos solo requiere cambiar la dirección de optimización
- Soporta recuperación de partes reales/imaginarias de tensores complejos
- Aplicable a otros formatos de tensor como Tucker, TT, etc.

Configuración Experimental

Conjuntos de Datos

1. Datos Sintéticos (Experimento 4.1)

Tensores CP Aleatorios: 100 tensores CP generados aleatoriamente
Configuración de Parámetros:
- Orden $d \in [3, 10]$ (entero aleatorio)
- Dimensión $n_p \in [2, 15-d]$ (entero aleatorio)
- Rango CP $R \in [2, 10]$ (entero aleatorio)
Tipos de Distribución: Los factores CP siguen distribuciones uniformes $U(-1,1)$ , $U(0,0.75)$ , $U(0,1)$

2. Tensores CP Generados por Funciones Multivariadas (Experimento 4.2)

Función Griewank: $f(\mathbf{z}) = \sum_{p=1}^{d} \frac{z_p^2}{4000} - \prod_{p=1}^{d} \cos(\frac{z_p}{\sqrt{p}}) + 1$ , $z_p \in [-600, 600]$
Función Schwefel: $f(\mathbf{z}) = 418.9829d - \sum_{p=1}^{d} z_p \sin(\sqrt{|z_p|})$ , $z_p \in [-500, 500]$
Dimensión: $d=10$
Tamaño de Malla: $n \in \{128, 256, 512, 1024\}$ por dimensión

3. Simulación de Circuitos Cuánticos (Experimento 4.3)

Circuito de Transformada de Fourier Cuántica (QFT)
Número de Qubits: $d \in \{9, 16, 25, 36, 49\}$ (donde $d=l^2$ , $l \in \{3,4,5,6,7\}$ )
Modelo CP de Subespacio: Se reordena el estado cuántico como tensor de orden $p$ (donde $d=pq$ , $p=q=l$ )
Estado Inicial: Tensor de rango uno generado aleatoriamente, con elementos complejos cuyas partes reales e imaginarias siguen $U(0,1)$

Métricas de Evaluación

Precisión (Accuracy): $\text{Precisión} = \frac{\#\text{aciertos}}{S}$ donde $\#\text{aciertos}$ es el número de veces que se identifican correctamente los elementos máximos/mínimos, y $S=100$ es el número de tensores de prueba
Valor del Elemento: El valor de los elementos top- $k$ recuperados o su suma, utilizado para evaluar la proximidad al valor real
Estabilidad: Se muestra la distribución de valores bajo diferentes distribuciones y puntos atípicos mediante diagramas de caja

Métodos de Comparación

Power Iteration (Espig et al. 2020):
- Método de iteración de potencia, con recompresión introducida cuando el rango CP excede 10
- Aplicación de transformación de desplazamiento para hacer el tensor no negativo
- Determinación de la ubicación del elemento máximo mediante aproximación de rango uno
Star Sampling (Lu et al. 2017):
- Método de muestreo, número de nodos = 2, número de muestras = $\min(10^4, \lfloor 20\% \times \#P(\mathcal{A}) \rfloor)$
- Variantes: Star Sampling+1, Star Sampling+5 (expansión del espacio de búsqueda)
MinCPD vía Frank-Wolfe (Sidiropoulos et al. 2023):
- Método de descenso de gradiente proyectado
- Solo aplicable para $k=1$

Detalles de Implementación

Entorno de Programación: Python + biblioteca TensorLy (backend NumPy)
Plataforma de Hardware: Computadora portátil
Parámetros del Algoritmo Propuesto:
- Parámetro de bloque $s \in \{1, 2\}$
- Parámetro de expansión $K \in \{1, 5\}$
- Notación: Ours( $s$ )+ $K$ indica parámetro de bloque $s$ y espacio de búsqueda expandido a $k+K$

Resultados Experimentales

Resultados Principales

Experimento 4.1: Tensores CP Aleatorios ( $k=1$ , Recuperación de Elemento Máximo)

Comparación de Precisión (Figura 3d):

Distribución $U(-1,1)$ :
- Power Iteration: ~25%, Star Sampling: ~15%, MinCPD: ~11%
- Ours(1)+1: ~52% (mejora de 108.0%, 246.7%, 372.7%)
Distribución $U(0,0.75)$ :
- Power Iteration: ~68%, Star Sampling: ~42%, MinCPD: ~52%
- Ours(1)+1: ~79% (mejora de 16.2%, 88.1%, 51.9%)
Distribución $U(0,1)$ :
- Power Iteration: ~62%, Star Sampling: ~28%, MinCPD: ~53%
- Ours(1)+1: ~60% (estabilidad óptima)

Hallazgos Clave:

Star Sampling en distribución $U(-1,1)$ produce valores muy alejados del valor real (Figura 3a)
MinCPD es sensible a la escala numérica
El algoritmo propuesto mantiene estabilidad en todas las distribuciones, con precisión superior al 50%

Experimento 4.1: Tensores CP Aleatorios ( $k=1$ , Recuperación de Elemento Mínimo)

Comparación de Precisión (Figura 4d):

MinCPD tiene precisión ≤40% en todas las distribuciones
Ours(1)+1 alcanza 48.0%~93.0%
Ours(2)+5 mejora aún más la precisión

Comparación de Valores (Figura 4a): Los valores obtenidos por el algoritmo propuesto son generalmente más pequeños (más cercanos al valor mínimo real)

Experimento 4.1: Tensores CP Aleatorios ( $k=5$ , Recuperación de Elemento Máximo)

Comparación de Precisión (Figura 5d):

Star Sampling: <45% (todas las distribuciones)
Ours(1)+1: 59.0% ( $U(-1,1)$ ), 84.0% ( $U(0,0.75)$ ), 82.0% ( $U(0,1)$ )
Ours(2)+5: Alcanza hasta 87.8%

Comparación de Valores (Figura 5a): Star Sampling en $U(-1,1)$ produce suma <0 (desviación severa)

Experimento 4.1: Tensores CP Aleatorios ( $k=5$ , Recuperación de Elemento Mínimo)

Precisión (Figura 6d):

Ours(1)+1: 55.2%~87.8%
Ours(2)+5: Mejora adicional, alcanzando hasta 87.8%

Impacto de Parámetros:

Aumentar parámetro de bloque $s$ : Expande el espacio de búsqueda, mejora la precisión
Aumentar parámetro de expansión $K$ : Mejora significativa para distribución $U(-1,1)$ (mejora de 21.0%~188.9%)

Experimento 4.2: Tensores CP de Funciones Multivariadas (Recuperación de Elemento Mínimo)

Comparación de Valor Mínimo Promedio (Tabla 1):

Función Griewank:
- $n=128$ : MinCPD=22.87, Ours(2)=8.79 (menor por 14.08)
- $n=1024$ : MinCPD=1.82, Ours(2)=1.68 (menor por 0.14)
Función Schwefel:
- $n=128$ : MinCPD=507.44, Ours(2)=212.00 (menor por 295.44)
- $n=1024$ : MinCPD=178.04, Ours(2)=36.25 (menor por 141.79)

Estabilidad (Figura 7): MinCPD tiene más puntos atípicos, el algoritmo propuesto es más estable

Experimento 4.3: Simulación de Circuitos Cuánticos

Precisión (Figura 9):

9 Qubits (Rango CP=8): Ours(2)+5 alcanza 100% ( $k=5$ )
16 Qubits (Rango CP=20): Ours(2)+5 alcanza 90.6%
25 Qubits (Rango CP=56): Ours(2)+5 alcanza 90.2%
La precisión de los métodos de referencia disminuye con el aumento del número de qubits, mientras que el algoritmo propuesto mantiene estabilidad

Comparación de Valores (Tabla 2, $k=5$ ):

49 Qubits:
- Power Iteration: $1.19 \times 10^{-12}$ (fallo severo)
- Star Sampling+5: $2.22 \times 10^{-7}$
- Ours(2)+5: $9.97 \times 10^{-7}$ (máximo)

Hallazgos Clave:

Power Iteration falla en problemas de gran escala (error dominante)
El algoritmo propuesto obtiene valores máximos incluso en casos de 36 y 49 qubits (donde la memoria insuficiente impide verificar valores reales)
La estabilidad no disminuye con el aumento de la escala del problema

Experimentos de Ablación

Aunque el artículo no etiqueta explícitamente experimentos de ablación, demuestra contribuciones de componentes a través de variaciones de parámetros:

Impacto del Parámetro de Bloque $s$ :
- $s=1 \to s=2$ : Mejora de precisión, especialmente en distribución $U(-1,1)$
- Costo: Aumento de gastos computacionales y de memoria
Impacto del Parámetro de Expansión $K$ :
- $K=1 \to K=5$ : Mejora significativa en distribuciones difíciles ( $U(-1,1)$ )
- Mejora limitada en distribuciones simples ( $U(0,1)$ )

Análisis de Casos

El artículo demuestra mediante visualización (Figuras 3-7, Figura 9):

Diagramas de caja mostrando distribución de valores y estabilidad
Gráficos de barras de precisión comparando diferentes métodos
Experimentos de circuitos cuánticos demostrando efectividad en aplicaciones reales

Hallazgos Experimentales

Sensibilidad a Distribución de Datos: Todos los métodos son sensibles a la distribución de datos, pero el algoritmo propuesto es relativamente el más estable
Robustez de Escala: Los métodos de referencia muestran degradación de rendimiento en problemas de gran escala, mientras que el algoritmo propuesto mantiene estabilidad
Verificación de Universalidad: Aplicación exitosa a recuperación de elementos máximos/mínimos, diferentes valores de $k$ , tensores complejos
Importancia de Ajuste de Parámetros: La configuración apropiada de $s$ y $K$ es crucial para la precisión

Trabajo Relacionado

1. Representación de Descomposición de Tensores

Descomposición CP (Hitchcock 1927), Descomposición Tucker (Tucker 1966), Cadena de Tensores (TT) (Oseledets 2011)
Aplicaciones: Computación científica, teledetección, visión por computadora, sistemas de recomendación

2. Métodos de Recuperación de Elementos Top- $k$

Métodos de Muestreo:

Diamond sampling (Ballard et al. 2015, matrices)
Star sampling (Lu et al. 2017, tensores CP)
Otros métodos de muestreo para diferentes formatos (Sozykin et al. 2022; Chertkov et al. 2023; Ryzhakov et al. 2024)

Métodos de Optimización Continua:

Problema de valores propios simétricos (Espig et al. 2013, 2020)
Iteración de potencia/iteración inversa (Espig et al. 2020; Soley et al. 2021)
Descenso de gradiente proyectado (Sidiropoulos et al. 2023)

3. Campos de Aplicación

Sistemas de Recomendación (Symeonidis 2016; Frolov & Oseledets 2017)
Simulación Cuántica (Zhou et al. 2020; Yuan et al. 2021; Ma & Yang 2022)
Problemas de Optimización (Sozykin et al. 2022; Sidiropoulos et al. 2023)

Ventajas del Presente Trabajo

Primera utilización sistemática de estructura de rango uno en modelado
Primer método de optimización continua que soporta $k>1$
Universalidad y estabilidad significativamente superiores a métodos existentes

Conclusiones y Discusión

Conclusiones Principales

Se propone un modelado de optimización continua con restricciones basado en estructura de rango uno (Teorema 1)
Se desarrolla un algoritmo iterativo de bloques alternantes que descompone efectivamente problemas de gran escala
Los experimentos numéricos verifican la superioridad del algoritmo en múltiples escenarios:
- Mejora de precisión: 16%~373% (comparado con métodos de referencia)
- Estabilidad: Robustez ante diferentes distribuciones de datos
- Universalidad: Soporta máximos/mínimos, diferentes valores de $k$ , tensores complejos
Se demuestra valor de aplicación práctica en simulación de circuitos cuánticos

Limitaciones

Complejidad Computacional:
- La resolución de subproblemas requiere reconstrucción del tensor CP de orden $s$ como tensor completo
- Complejidad temporal: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q R + \prod_{q} n_q \log(\prod_q n_q)$
- Complejidad espacial: $\prod_{q \in \{p_1,\ldots,p_s\}} n_q$
Sensibilidad de Parámetros:
- El parámetro de bloque $s$ requiere ajuste según la escala del problema
- El valor óptimo del parámetro de expansión $K$ depende de la distribución de datos
Optimalidad Local:
- El método heurístico no garantiza optimalidad global
- La determinación secuencial de soluciones puede perder combinaciones más óptimas
Análisis Teórico Insuficiente:
- Falta prueba de convergencia
- Ausencia de análisis de cota de error
Rango de Aplicabilidad:
- Enfocado principalmente en formato CP, aunque extensible a Tucker/TT sin validación suficiente
- Precisión aún mejorable para distribuciones extremas (como $U(-1,1)$ )

Direcciones Futuras

Direcciones explícitamente propuestas en el artículo:

Aplicación a más escenarios prácticos: sistemas de recomendación, medición de redes, biología computacional
Integración con métodos existentes de recuperación de elementos máximos/mínimos (Nota 3)
Estrategia de configuración adaptativa del parámetro de bloque $s$ (Nota 2)

Direcciones potenciales de extensión:

Análisis teórico de convergencia y cotas de error
Implementación paralela para mejorar eficiencia
Estrategia adaptativa de manejo de restricciones
Validación profunda en otros formatos de tensor

Evaluación Profunda

Fortalezas

Innovación en Modelado de Problemas:
- Primera utilización explícita de estructura de rango uno de tensores de vectores propios
- Reducción de escala del problema de optimización de $\prod_p n_p$ a $\sum_p n_p k$
- Derivación matemática rigurosa (Teoremas 1 y 2)
Diseño de Algoritmo Ingenioso:
- Estrategia de descomposición en bloques que equilibra efectivamente eficiencia y precisión
- Utilización natural y eficiente de estructura de suma separable
- Manejo de restricciones mediante coeficiente $\beta$ evitando complejidad exponencial
Diseño Experimental Completo:
- Tres categorías de conjuntos de datos: sintéticos, generados por funciones, aplicaciones reales
- Comparación multidimensional: precisión, valor, estabilidad
- Múltiples escenarios: $k=1$ y $k=5$ , elementos máximos y mínimos, tensores complejos
- Análisis suficiente de parámetros ( $s$ y $K$ )
Alto Valor Práctico:
- Demostración de efectividad en simulación de circuitos cuánticos
- Mejora significativa de precisión (hasta 372.7%)
- Algoritmo simple, fácil de implementar
Escritura Clara:
- Estructura lógica, presentación clara
- Figuras y tablas abundantes (9 figuras, 2 tablas)
- Diagrama de flujo de trabajo (Figura 2) que presenta el algoritmo intuitivamente

Insuficiencias

Insuficiencia Teórica:
- Falta prueba de convergencia
- Sin cotas de error o garantías de aproximación
- Fundamento teórico débil del método heurístico
Análisis Insuficiente de Eficiencia Computacional:
- No se reportan tiempos de ejecución reales
- Falta comparación de eficiencia con métodos de referencia
- No se proporcionan mediciones reales de gastos de memoria
Limitaciones Experimentales:
- Experimentos con tensores aleatorios solo 100 muestras, falta prueba de significancia estadística
- Sin pruebas en problemas de escala ultra grande (como $d>10$ , $n_p>1024$ )
- Experimentos de circuitos cuánticos limitados por memoria, sin verificación de precisión real para 36 y 49 qubits
Limitaciones de Método:
- Precisión aún relativamente baja para distribución extrema ( $U(-1,1)$ ) (~60%)
- Parámetros $s$ y $K$ requieren ajuste manual, falta estrategia adaptativa
- Resolución de subproblemas depende de reconstrucción de tensor completo, limitando escalabilidad
Comparación Incompleta:
- Sin comparación con métodos recientes de optimización de tensores (como TTOpt, PROTES)
- Falta comparación con métodos de aprendizaje profundo
- MinCPD solo soporta $k=1$ , comparación no completamente justa
Código No Público: Afecta reproducibilidad e aplicación práctica

Impacto

Contribución al Campo:

Proporciona nueva perspectiva de optimización continua para recuperación de tensores top- $k$
Marco de iteración de bloques alternantes puede inspirar solución de otros problemas de tensores
Valor de aplicación directa en computación cuántica

Valor Práctico:

Mejora significativa en precisión y estabilidad
Aplicable a sistemas de recomendación, simulación cuántica y otros campos
Algoritmo relativamente simple, fácil de implementar

Reproducibilidad:

Descripción detallada del algoritmo (Algoritmo 1)
Configuración experimental clara
Pero código no público, requiere implementación propia

Impacto Esperado:

Corto plazo: Proporciona nueva herramienta para tareas de recuperación de tensores
Largo plazo: Puede influir en paradigma de diseño de algoritmos de optimización de tensores
Potencial de citas: Medio (en campos de análisis numérico y computación de tensores)

Escenarios Aplicables

Escenarios Más Adecuados:

Tensores CP de Escala Media ( $d \leq 10$ , $n_p \leq 1000$ , $R \leq 100$ )
Distribución de Datos Relativamente Uniforme (como $U(0,1)$ )
Aplicaciones que Requieren Alta Precisión y Estabilidad
Fase de Medición en Simulación de Circuitos Cuánticos
Tareas de Recuperación con Valores de $k$ Pequeños ( $k \leq 10$ )

Escenarios Menos Adecuados:

Tensores de Escala Ultra Grande (limitaciones de memoria)
Distribuciones de Datos Extremas (como altamente desequilibradas)
Aplicaciones con Requisitos Estrictos de Tiempo Real (resolución de subproblemas relativamente lenta)
Valores de $k$ Muy Grandes (cercanos al número total de elementos del tensor)

Estrategia Recomendada:

Comenzar con $s=2, K=1$
Si la precisión es insuficiente, aumentar $K$ a 5
Si la memoria lo permite, intentar $s=3$
Usar en combinación con métodos de muestreo para mejorar robustez

Referencias (Seleccionadas)

Espig et al. (2013, 2020): Trabajo fundamental en modelo de valores propios simétricos
Lu et al. (2017): Método de star sampling
Sidiropoulos et al. (2023): Método MinCPD de descenso de gradiente proyectado
Oseledets (2011): Descomposición de cadena de tensores (TT)
Kolda & Bader (2009): Revisión de descomposición de tensores
Ma & Yang (2022): Aproximación de bajo rango en simulación cuántica

Evaluación General: Este es un artículo sólido de análisis numérico que aborda el importante problema de recuperación de elementos top- $k$ de tensores, proponiendo modelado innovador y algoritmo. La verificación experimental es suficiente y el valor práctico es alto. Las principales insuficiencias están en análisis teórico y evaluación de eficiencia computacional. Para investigadores e ingenieros en campos de computación de tensores y simulación cuántica, este es un trabajo que merece atención. Se recomienda que los autores complementen análisis teórico, publiquen código y verifiquen en problemas de mayor escala en futuro.

A Novel Block-Alternating Iterative Algorithm for Retrieving Top-$k$ Elements from Factorized Tensors

Un Algoritmo Iterativo Novedoso de Bloques Alternantes para Recuperar los Elementos Top-kkk de Tensores Factorizados

Un Algoritmo Iterativo Novedoso de Bloques Alternantes para Recuperar los Elementos Top- $k$ de Tensores Factorizados