We study the algorithmic problem of multiplying large matrices that are rectangular. We prove that the method that has been used to construct the fastest algorithms for rectangular matrix multiplication cannot give algorithms with complexity $n^{p + 1}$ for $n \times n$ by $n \times n^p$ matrix multiplication. In fact, we prove a precise numerical barrier for this method. Our barrier improves the previously known barriers, both in the numerical sense, as well as in its generality. In particular, we prove that any lower bound on the dual exponent of matrix multiplication $α$ via the big Coppersmith-Winograd tensors cannot exceed 0.6218.
- ID de l'article : 2003.03019
- Titre : Barriers for rectangular matrix multiplication
- Auteurs : Matthias Christandl, François Le Gall, Vladimir Lysikov, Jeroen Zuiddam
- Classification : cs.CC (Complexité Computationnelle), math.AC (Algèbre Commutative)
- Date de publication : 10 novembre 2025 (version arXiv)
- Lien de l'article : https://arxiv.org/abs/2003.03019
Cet article étudie les problèmes algorithmiques de la multiplication de grandes matrices rectangulaires. Les auteurs démontrent que les méthodes utilisées pour construire les algorithmes les plus rapides de multiplication de matrices rectangulaires ne peuvent pas fournir un algorithme de complexité np+1 pour la multiplication de matrices n×n par n×np. En réalité, les auteurs établissent des barrières numériques précises pour cette approche. Cette barrière améliore les barrières précédemment connues tant en termes de valeur numérique que de généralité. En particulier, les auteurs démontrent que toute borne inférieure sur l'exposant dual α de la multiplication de matrices obtenue via les grands tenseurs de Coppersmith-Winograd ne peut pas dépasser 0,6218.
- Problème de complexité de la multiplication de matrices : Étant donné deux grandes matrices, combien d'opérations arithmétiques scalaires sont nécessaires pour calculer leur produit matriciel ? L'algorithme standard nécessite environ 2n3 opérations pour deux matrices carrées n×n, mais la borne théorique inférieure est seulement n2.
- Multiplication de matrices rectangulaires : Dans les applications pratiques, les matrices à multiplier sont généralement rectangulaires plutôt que carrées. Pour tout nombre réel non-négatif p, étant donné une matrice n×⌈np⌉ et une matrice ⌈np⌉×n, combien d'opérations sont nécessaires pour calculer leur produit ?
- Définition de l'exposant : ω(p) représente l'exposant optimal de n dans le nombre d'opérations requis par tout algorithme arithmétique, avec des bornes a priori max(2,1+p)≤ω(p)≤2+p.
- Importance théorique : Comprendre ω(p) n'est pas seulement pertinent pour la multiplication de matrices rectangulaires, mais constitue également un moyen de prouver ω=2 (l'exposant optimal pour la multiplication de matrices carrées).
- Applications pratiques : La multiplication de matrices rectangulaires a des applications directes dans la résolution de programmes linéaires, la minimisation du risque empirique et d'autres domaines.
- Limitations techniques : Les techniques actuelles rencontrent un goulot d'étranglement dans l'amélioration des bornes supérieures, nécessitant une compréhension de ses limitations fondamentales.
- Établissement d'un cadre de barrière universel : Établit des barrières numériques précises pour les principales techniques actuelles de construction d'algorithmes de multiplication de matrices rectangulaires.
- Amélioration des bornes numériques : Améliore les résultats de barrière précédents tant en termes de valeur numérique que de généralité.
- Introduction de tenseurs de multiplication de matrices virtuels : Introduit de nouveaux outils mathématiques pour traiter les cas où p n'est pas un entier.
- Analyse des méthodes catalytiques : Étudie les structures d'algorithmes plus complexes incluant des tenseurs catalytiques.
- Bornes précises sur l'exposant dual : Démontre que les bornes inférieures sur α obtenues via les tenseurs de Coppersmith-Winograd ne peuvent pas dépasser 0,6218.
Étudier le problème de multiplication de matrices rectangulaires : étant donné une matrice A de dimensions n×⌈np⌉ et une matrice B de dimensions ⌈np⌉×n, calculer le nombre d'opérations arithmétiques nécessaires pour calculer le produit AB. L'objectif est de comprendre les limitations fondamentales des techniques actuelles dans l'amélioration de la borne supérieure de complexité ω(p).
Les problèmes de multiplication de matrices correspondent à des familles de tenseurs :
- La multiplication d'une matrice ℓ×m par une matrice m×n correspond au tenseur : ⟨ℓ,m,n⟩=∑i=1ℓ∑j=1m∑k=1nxijyjkzki
- Le problème unitaire correspond au tenseur diagonal : ⟨n⟩=∑i=1nxiyizi
Plusieurs types de réductions tensoriales sont définis :
- Restriction (S≤T) : Il existe des applications linéaires telles que S=T∘(A,B,C)
- Dégénérescence (S◃T) : S=limϵ→0T(A(ϵ)x,B(ϵ)y,C(ϵ)z)
- Restriction/Dégénérescence monomiale : Les matrices A,B,C ont au maximum un élément non-nul par ligne et par colonne
Définit la classe de paramètres de tenseurs appropriés F, qui doivent satisfaire :
- Monotonie pour ≤ : S≤T⇒F(S)≤F(T)
- Sous-multiplicativité pour ⊗ : F(S⊗T)≤F(S)⋅F(T)
- Multiplicativité MaMu-⊗ : F(⟨ℓ1ℓ2,m1m2,n1n2⟩)=F(⟨ℓ1,m1,n1⟩)⋅F(⟨ℓ2,m2,n2⟩)
- Additivité pour ⊕ : F(T⊕s)=s⋅F(T)
- Borne de rang asymptotique : F(T)≤R~(T)
Pour traiter les nombres réels p, introduit le symbole formel ⟨2,2,2p⟩ :
- Quand p=logab (a,b sont des entiers positifs) : F(⟨2,2,2p⟩)=2logaF(⟨a,a,b⟩)
- Sinon, défini par l'infimum : F(⟨2,2,2p⟩)=inf{F(⟨2,2,2P⟩)∣P≥p,∃a,b∈Z≥0:P=logab}
En appliquant les paramètres appropriés F,G aux deux extrémités de la chaîne d'algorithmes :
⟨n,n,m⟩⊕s≤T⊗k≤⟨r⟩⊗kb
On obtient :
logF(T)logF(⟨2,2,2p⟩)logR~(T)≤ω(p)
Utilise la fonctionnelle de support supérieur de Strassen comme paramètre approprié :
ζθ(T)=minS≅TmaxP∈P(supp(S))2∑i∈[3]θiH(Pi)
où θ=(θ1,θ2,θ3)∈P([3]), et H est l'entropie de Shannon.
Analyse le tenseur CW :
CWq(x,y,z)=x0y0zq+1+x0yq+1z0+xq+1y0z0+∑i=1q(x0yizi+xiy0zi+xiyiz0)
On sait que R~(CWq)=q+2.
Le calcul de barrière se transforme en un problème d'optimisation convexe :
maxθmaxP∑i=13θiH(Pi)2θ1+(p+1)(θ2+θ3)log2(q+2)
Pour le tenseur CWq, les valeurs de barrière pour ω(2) :
| q | ω(2)≥ | θ1 optimal |
|---|
| 2 | 3,0626 | 0,096 |
| 6 | 3,1039 | 0,136 |
| 10 | 3,1409 | 0,165 |
| 14 | 3,1714 | 0,185 |
| q | Barrière α |
|---|
| 2 | 0,6218 |
| 6 | 0,5408 |
| 10 | 0,4914 |
| 14 | 0,4529 |
Résultat clé : Toute borne inférieure sur α obtenue via une dégénérescence de CWq (pour tout q) ne peut pas dépasser 0,6218.
- Alman-Vassilevska Williams AW18a : La dégénérescence monomiale via CW6 ne peut donner que α≥0,871
- Cet article : Une dégénérescence plus forte via CW6 ne peut donner que α≥0,543
- Meilleure borne inférieure actuelle : α>0,321334 WXXZ24
Pour les méthodes κ-catalytiques, la barrière est renforcée à :
ω(p)≥logF(T)logF(⟨2,2,2p⟩)logR~(T)+κ(logF(T)logR~(T)−1)
- Ambainis-Filmus-Le Gall AFLG15 : Première preuve de barrière en multiplication de matrices, montrant que certaines méthodes ne peuvent pas atteindre ω=2.
- Alman-Vassilevska Williams AW18a,AW18b :
- Extension à la dégénérescence monomiale
- Première étude des barrières pour la multiplication de matrices rectangulaires
- Basée sur l'analyse du rang asymptotique indépendant
- Blasiak et al. BCC+17a,BCC+17b : Étude des barrières pour les méthodes théoriques des groupes.
- Christandl-Vrana-Zuiddam CVZ19 :
- Barrières de dégénérescence plus générales
- Basées sur l'irréversibilité tensorielle
- Utilisant des fonctionnelles quantiques et des fonctionnelles de support
- Bornes numériques plus élevées : Obtient des barrières plus serrées comparé aux travaux antérieurs
- Portée plus large : S'applique non seulement à 0≤p≤1, mais aussi à p≥1
- Cadre unifié : Couvre tous les concepts de réduction connus
- Analyse des méthodes mixtes : Première analyse systématique des méthodes de tenseurs intermédiaires mixtes
- Limitations fondamentales : Les techniques principales actuelles (méthodes de dégénérescence basées sur les tenseurs de Coppersmith-Winograd) présentent des limitations fondamentales dans l'amélioration de la complexité de la multiplication de matrices rectangulaires.
- Bornes numériques précises : Toute borne inférieure sur l'exposant dual α obtenue via n'importe quel tenseur CWq ne peut pas dépasser 0,6218, bien en deçà de la valeur théorique maximale de 1.
- Goulot d'étranglement technique : Démontre pourquoi les techniques actuelles ne peuvent pas réduire significativement l'écart entre les bornes supérieures et inférieures de ω(p).
- Spécificité de la méthode : Les barrières s'appliquent uniquement aux méthodes basées sur des tenseurs intermédiaires spécifiques (comme les tenseurs CW), n'excluant pas d'autres approches algorithmiques possibles.
- Nature des bornes inférieures : Ce sont des barrières méthodologiques plutôt que des bornes inférieures du problème lui-même, n'excluant pas l'existence d'algorithmes meilleurs.
- Complexité computationnelle : Les calculs numériques dépendent de l'optimisation convexe, ce qui peut présenter des défis computationnels pour les tenseurs plus grands.
- Nouveaux tenseurs intermédiaires : Recherche de nouveaux tenseurs intermédiaires non soumis aux barrières actuelles.
- Méthodes non-tensoriques : Exploration de nouveaux paradigmes de conception algorithmique non basés sur la dégénérescence tensorielle.
- Étanchéité des barrières : Étude de la question de savoir si les barrières démontrées sont étanches.
- Types de réductions plus généraux : Analyse des barrières sous des concepts de réduction plus généraux.
- Profondeur théorique : Établit un cadre théorique complet des barrières avec une rigueur mathématique élevée.
- Innovations techniques :
- L'introduction des tenseurs de multiplication de matrices virtuels traite élégamment le problème des exposants non-entiers
- L'abstraction des paramètres de tenseurs appropriés fournit un outil d'analyse unifié
- Valeur pratique : Les résultats numériques précis fournissent aux concepteurs d'algorithmes des indications claires sur les limitations techniques.
- Complétude : Couvre la chaîne complète allant de la théorie fondamentale aux calculs concrets.
- Limitations des barrières : S'appliquent uniquement à des types spécifiques d'algorithmes, il peut exister des méthodes contournant ces barrières.
- Dépendance computationnelle : Les résultats numériques dépendent du calcul des fonctionnelles de support, ce qui peut être difficile pour les tenseurs plus complexes.
- Analyse des écarts : Bien que les barrières soient démontrées, l'analyse approfondie de ce que l'écart entre les barrières et les meilleurs résultats actuels signifie n'est pas fournie.
- Contribution théorique : Fournit de nouveaux outils d'analyse et perspectives pour la théorie de la complexité.
- Orientation pratique : Aide les chercheurs à comprendre les limitations des techniques actuelles et guide les directions de recherche futures.
- Valeur méthodologique : Le cadre d'analyse des barrières peut s'appliquer à d'autres problèmes de conception algorithmique.
- Conception d'algorithmes : Fournit une orientation théorique aux concepteurs d'algorithmes de multiplication de matrices.
- Analyse de complexité : Fournit des références méthodologiques pour l'analyse des barrières d'autres problèmes algébriques.
- Théorie de l'optimisation : Possède une valeur d'application dans les scénarios nécessitant de comprendre les limitations fondamentales des algorithmes.
Les principaux travaux connexes incluent :
- AFLG15 Ambainis, Filmus, Le Gall: Fast matrix multiplication limitations
- AW18a Alman, Vassilevska Williams: Further limitations of known approaches
- CVZ19 Christandl, Vrana, Zuiddam: Barriers from irreversibility
- CW90 Coppersmith, Winograd: Matrix multiplication via arithmetic progressions
- Str91 Strassen: Degeneration and complexity of bilinear maps