In this note, we briefly present a generalized tensor CUR (GTCUR) approximation for tensor pairs (X,Y) and tensor triplets (X,Y,Z) based on the tubal product (t-product). We use the tensor Discrete Empirical Interpolation Method (TDEIM) to do these extensions. We show how the TDEIM can be utilized to generalize the classical tensor CUR (TCUR) approximation, which acts only on a single tensor, to jointly compute the TCUR of two and three tensors. This approach can be used to sample relevant lateral/horizontal slices of one data tensor relative to one or two other data tensors. For some special cases, the Generalized TCUR (GTCUR) approximation is reduced to the classical TCUR for both tensor pairs and tensor triplets in a similar fashion as shown for the matrices.
- ID de l'article: 2305.00754
- Titre: A note on generalized tensor CUR approximation for tensor pairs and tensor triplets based on the tubal product
- Auteurs: Salman Ahmadi-Asl (Université Innopolis), Naeim Rezaeian (Université de l'Amitié des Peuples de Russie)
- Classification: math.NA cs.NA
- Date de publication: Prépublication arXiv, mai 2023 (dernière version janvier 2025)
- Lien de l'article: https://arxiv.org/abs/2305.00754
Cet article propose une méthode d'approximation généralisée du tenseur CUR (GTCUR) basée sur le produit tubulaire (t-product) pour les paires de tenseurs (X,Y) et les triplets de tenseurs (X,Y,Z). Les auteurs utilisent la méthode d'interpolation empirique discrète tensorielle (TDEIM) pour réaliser ces extensions, montrant comment exploiter TDEIM pour généraliser l'approximation classique du tenseur CUR (TCUR), qui n'agit que sur un seul tenseur, au calcul conjoint du TCUR pour deux ou trois tenseurs. La méthode peut être utilisée pour échantillonner les tranches latérales/horizontales pertinentes d'un tenseur de données par rapport à un ou deux autres tenseurs de données.
- Problème à résoudre: La décomposition CUR classique ne peut traiter que des matrices ou tenseurs individuels et ne peut pas traiter simultanément plusieurs structures de données connexes. Dans les applications pratiques, il est souvent nécessaire d'analyser simultanément plusieurs données tensorielles connexes et d'extraire les caractéristiques les plus discriminantes d'un ensemble de données par rapport à d'autres.
- Importance du problème:
- Les ensembles de données du monde réel possèdent généralement une structure multidimensionnelle qui nécessite de préserver la structure des tenseurs de données
- Les applications telles que la découverte de sous-groupes, la récupération de données bruitées en couleur et l'analyse de corrélation canonique nécessitent le traitement simultané de plusieurs tenseurs
- Les méthodes traditionnelles ne peuvent pas exploiter efficacement les informations communes entre plusieurs tenseurs
- Limitations des méthodes existantes:
- Le CUR matriciel (MCUR) ne peut traiter qu'une seule matrice
- Les méthodes de décomposition tensorielle existantes telles que la décomposition Tucker et la décomposition CP ne peuvent pas fournir une approximation de rang faible optimale lors de la troncature
- Absence d'un cadre de traitement unifié pour les multi-tenseurs
- Motivation de la recherche: Inspirés par les applications réussies du MCUR généralisé dans le cas matriciel, les auteurs souhaitent étendre cette idée au cas tensoriel, en exploitant les excellentes propriétés de la SVD tensorielle basée sur le t-product, et développer une méthode GTCUR capable de traiter simultanément plusieurs tenseurs.
- Proposition d'une méthode généralisée du tenseur CUR (GTCUR): Première extension de l'approximation CUR du cas d'un seul tenseur aux cas de paires et triplets de tenseurs
- Développement d'une stratégie d'échantillonnage basée sur TDEIM: Utilisation de la méthode d'interpolation empirique discrète tensorielle pour sélectionner les tranches latérales/horizontales optimales
- Établissement de connexions théoriques: Preuve que le GTCUR peut se dégrader en TCUR classique dans des cas particuliers, similaire au cas matriciel
- Fourniture d'algorithmes efficaces: Présentation d'algorithmes rapides pour calculer le GTCUR, incluant une implémentation efficace dans le domaine de Fourier
- Extension de la théorie de la décomposition tensorielle: Établissement d'un cadre théorique complet basé sur la SVD tensorielle généralisée (GTSVD) et la SVD tensorielle restreinte (t-RSVD)
GTCUR pour paires de tenseurs: Étant donné deux tenseurs X∈RI1×I2×I3 et Y∈RI4×I2×I3, trouver l'approximation:
X≈C1∗U1∗R1,Y≈C2∗U2∗R2
GTCUR pour triplets de tenseurs: Étant donné trois tenseurs X∈RI1×I2×I3, Y∈RI1×I4×I3, Z∈RI5×I2×I3, trouver les approximations correspondantes.
L'article est basé sur le produit tubulaire (t-product) pour définir une série d'opérations tensoriques:
- t-product: C=X∗Y=fold(circ(X)⋅unfold(Y))
- Transposée tensorique: Transposition de toutes les tranches frontales et inversion de l'ordre
- Tenseur orthogonal: Satisfaisant XT∗X=X∗XT=I
X≈U∗S∗VT
où U et V sont des tenseurs orthogonaux et S est un tenseur f-diagonal.
L'idée centrale est de construire un opérateur de projection d'interpolation tensorique:
P=U∗(ST∗U)−1∗ST
Processus d'échantillonnage:
- Sélection de la première structure tubulaire ayant la norme euclidienne maximale
- Sélection itérative de l'indice ayant la norme maximale dans la tranche résiduelle
- Utilisation de l'opérateur de projection pour éliminer l'influence des directions déjà sélectionnées
- Cadre unifié de traitement multi-tenseur: Réalisation de la décomposition conjointe de multi-tenseurs par partage de matrices de facteurs
- Sélection d'indices basée sur GTSVD: Utilisation des facteurs communs fournis par la SVD tensorielle généralisée pour un échantillonnage cohérent des tranches
- Calcul efficace dans le domaine de Fourier: Toutes les opérations peuvent être exécutées en parallèle dans le domaine fréquentiel, améliorant considérablement l'efficacité de calcul
- Garanties théoriques: Fourniture d'une borne d'erreur ∥X−C∗U∗R∥F2≤(η~p+η~q)∑i=1I3∑t>R(σti)2
L'article fournit principalement une analyse théorique et un cadre algorithmique, incluant:
- Bornes théoriques de l'erreur d'approximation
- Analyse de la complexité de calcul
- Contrôle du nombre de condition
- CUR tensorique classique (TCUR)
- Méthode d'échantillonnage basée sur les scores de levier
- Méthode d'échantillonnage uniforme
- Utilisation de la transformée de Fourier rapide (FFT) pour implémenter le t-product
- Adoption de GTSVD randomisée pour réduire la complexité de calcul
- Fourniture de descriptions d'algorithmes de style MATLAB
L'article fournit principalement des résultats théoriques:
- Théorème 1: Borne supérieure de l'erreur d'approximation TCUR par échantillonnage TDEIM
- Théorème 3: Relation de connexion entre GTCUR pour paires de tenseurs et TCUR classique
- Théorème 4: Analyse des cas particuliers du GTCUR pour triplets de tenseurs
- Lorsque Y=I, le GTCUR se dégrade en TCUR classique
- Pour un tenseur inversible Y, le GTCUR est équivalent au TCUR de X∗Y−1
- Le nombre de condition est contrôlé par η~p et η~q
- Décomposition CUR matricielle: Travaux classiques de Goreinov et al.
- Décomposition tensorique: Décomposition Tucker, décomposition CP, décomposition tensor-train
- Méthodes basées sur le t-product: Cadre fondateur de Kilmer et al.
- SVD généralisée: GSVD et RSVD dans le cas matriciel
Comparé aux travaux existants, cet article est le premier à:
- Étendre la décomposition CUR au cas multi-tenseur
- Établir un cadre théorique complet basé sur le t-product
- Fournir un algorithme d'échantillonnage TDEIM efficace
- Extension réussie de l'approximation CUR du cas d'un seul tenseur aux paires et triplets de tenseurs
- TDEIM fournit une stratégie d'échantillonnage optimale
- Cadre théorique complet, incluant l'analyse d'erreur et les connexions de cas particuliers
- Algorithme efficace, pouvant être calculé en parallèle dans le domaine de Fourier
- Absence d'expériences numériques: L'article est principalement théorique, sans vérification numérique concrète
- Complexité de calcul: Le calcul de GTSVD reste un défi pour les tenseurs à grande échelle
- Scénarios d'application: Manque d'analyse détaillée des scénarios d'application concrets
- Sélection de paramètres: Pas de discussion sur les stratégies de sélection du paramètre de rang R
- Vérification de l'efficacité de la méthode dans les applications pratiques
- Développement d'algorithmes randomisés plus efficaces
- Étude de stratégies adaptatives pour la sélection de paramètres
- Extension aux cas de tenseurs d'ordre supérieur
- Contribution théorique significative: Première établissement d'un cadre théorique complet pour la décomposition CUR multi-tenseur
- Méthode novatrice: Exploitation astucieuse des facteurs communs de GTSVD pour le traitement conjoint de multi-tenseurs
- Algorithme efficace: L'implémentation basée sur FFT garantit l'efficacité de calcul
- Théorie rigoureuse: Fourniture d'une analyse d'erreur complète et de garanties de convergence
- Rédaction claire: Structure de l'article claire, dérivations mathématiques rigoureuses
- Manque de vérification expérimentale: En tant que note théorique, l'article manque d'expériences numériques pour vérifier l'efficacité pratique de la méthode
- Motivation d'application insuffisante: Bien que certaines applications soient mentionnées, les scénarios d'application concrets ne sont pas approfondis
- Problèmes d'extensibilité: Pour les tenseurs très volumineux, le calcul de GTSVD reste un goulot d'étranglement
- Sensibilité aux paramètres: Pas de discussion sur la sensibilité de la méthode à la sélection des paramètres
- Valeur théorique: Fourniture de nouveaux outils théoriques pour l'analyse multi-tenseur
- Potentiel pratique: Perspectives d'application dans le traitement d'images, l'analyse de signaux et autres domaines
- Reproductibilité: Fourniture de descriptions d'algorithmes détaillées, facilitant l'implémentation
- Recherche ultérieure: Établissement de fondations solides pour la recherche ultérieure dans les domaines connexes
- Analyse de données multimodales: Scénarios nécessitant le traitement simultané de plusieurs données tensorielles connexes
- Sélection de caractéristiques: Extraction de caractéristiques discriminantes d'un ensemble de données par rapport à d'autres
- Récupération de données bruitées: Utilisation de la structure commune de plusieurs tenseurs pour la récupération de données
- Réduction de dimensionnalité: Réduction de dimension tout en préservant la structure tensorique
L'article cite 24 références importantes, incluant principalement:
- Travaux classiques de Goreinov et al. sur la décomposition CUR
- Recherches fondatrices de Kilmer et al. sur le t-product
- Travaux récents de Gidisu et Hochstenbach sur le GMCUR matriciel
- Littérature connexe sur diverses méthodes de décomposition tensorique
Évaluation globale: Cet article est un travail théorique de haute qualité qui étend avec succès la décomposition CUR au cas multi-tenseur et établit un cadre théorique complet. Bien qu'il manque d'expériences numériques, la contribution théorique est significative et fournit de nouveaux outils pour l'analyse multi-tenseur. La valeur principale de l'article réside dans l'innovation théorique et les contributions méthodologiques, établissant une base solide pour la recherche d'applications pratiques ultérieures.