A non-commutative algorithm for multiplying 4x4 matrices using 48 non-complex multiplications
Dumas, Pernet, Sedoglavic
The quest for non-commutative matrix multiplication algorithms in small dimensions has seen a lot of recent improvements recently. In particular, the number of scalar multiplications required to multiply two $4\times4$ matrices was first reduced in \cite{Fawzi:2022aa} from 49 (two recursion levels of Strassen's algorithm) to 47 but only in characteristic 2 or more recently to 48 in \cite{alphaevolve} but over complex numbers. We propose an algorithm in 48 multiplications with only rational coefficients, hence removing the complex number requirement. It was derived from the latter one, under the action of an isotropy which happen to project the algorithm on the field of rational numbers. We also produce a straight line program of this algorithm, reducing the leading constant in the complexity, as well as an alternative basis variant of it, leading to an algorithm running in $7 n^{2+\frac{\log_2 3}{2}} +o\left(n^{2+\frac{log_2 3}{2}}\right)$ operations over any ring containing an inverse of 2.
academic
Un algorithme non-commutatif pour multiplier des matrices 4×4 en utilisant 48 multiplications non-complexes
Cet article propose un algorithme non-commutatif utilisant 48 multiplications scalaires pour calculer la multiplication de matrices 4×4, en utilisant uniquement des coefficients rationnels, sans nombres complexes. Il s'agit d'une amélioration de l'algorithme en domaine complexe proposé par AlphaEvolve11, obtenue par projection vers le domaine rationnel via des transformations isotropes (isotropy). L'article fournit également une implémentation en programme linéaire (straight-line program) et présente une variante de base alternative réalisant une complexité opératoire de 7n2+2log23+o(n2+2log23) sur tout anneau contenant l'inverse de 2.
Problème central: Rechercher des algorithmes non-commutatifs optimaux pour la multiplication de matrices de petites dimensions, en particulier réduire le nombre de multiplications scalaires requises. La multiplication matricielle est une opération fondamentale en informatique et en calcul numérique, dont l'efficacité affecte directement les performances de nombreuses applications.
Importance:
La complexité temporelle de la multiplication matricielle affecte directement l'efficacité du calcul d'algèbre linéaire, de l'apprentissage automatique, du calcul scientifique et d'autres domaines
L'algorithme de Strassen (1969) a d'abord réduit la complexité de O(n3) à O(n2.81), ouvrant la recherche sur la multiplication matricielle rapide
Les algorithmes de multiplication matricielle de petites dimensions peuvent être appliqués récursivement à des matrices plus grandes, ce qui a une valeur d'application pratique
Limitations des méthodes existantes:
L'algorithme de Strassen nécessite 49 multiplications sur des matrices 4×4 (deux niveaux de récursion)
Fawzi et al. 5 ont réalisé 47 multiplications sur des corps de caractéristique 2
AlphaEvolve11 a trouvé un algorithme avec 48 multiplications en utilisant des modèles de langage de grande taille et des agents de codage évolutifs, mais nécessite des coefficients complexes
Les coefficients complexes limitent l'application de l'algorithme sur certains anneaux (comme l'anneau des entiers, les corps finis)
Motivation de la recherche:
Éliminer l'exigence de nombres complexes pour rendre l'algorithme applicable à des structures algébriques plus larges
Utiliser les symétries de la théorie de la décomposition tensorielle (actions du groupe d'isotropie) pour transformer systématiquement l'algorithme
Fournir une implémentation pratique en programme linéaire, optimisant les termes constants
Contribution théorique majeure: Prouver l'existence de points rationnels dans l'orbite d'isotropie de l'algorithme AlphaEvolve, proposer un algorithme avec coefficients purement rationnels utilisant 48 multiplications
Contribution méthodologique: Appliquer systématiquement la théorie du groupe d'isotropie de la décomposition tensorielle, projeter l'algorithme du domaine complexe vers le domaine rationnel via des transformations isotropes (Équation 24)
Contributions pratiques:
Fournir une implémentation complète en programme linéaire (Listings 1-4), totalisant 341 opérations
Borne théorique de complexité: 11.65625n2.792−10.65625n2
Fournir une variante de base alternative nécessitant seulement 6 opérations (1+2+3), avec complexité 7n2.792
Généralité: L'algorithme s'applique à tout anneau contenant l'inverse de 2, élargissant la portée des applications
Implémentation open-source: Toutes les matrices et codes sont disponibles publiquement dans la bibliothèque PLinOpt
Entrée: Deux matrices 4×4 A=(aij) et B=(bij), avec éléments d'un anneau R contenant 21 Sortie: Matrice produit C=A⋅B=(cij) Contrainte: Minimiser le nombre de multiplications scalaires, en utilisant uniquement des coefficients rationnels (éviter les nombres complexes)
L'algorithme de Strassen pour la multiplication de matrices 2×2 (7 multiplications) correspond à une décomposition de rang tensoriel 7, de type X2Y2Z2+6XYZ.
L'innovation centrale de cet article est de trouver une transformation isotrope spécifique (Équation 24):
I00−101−I00I−10I001⊗I00−I0−I−I00−II01001⊗1000010000100001
Après application de l'isotropie ci-dessus, on obtient une décomposition de 48 tenseurs de rang un (Équations 25-72), chacun de la forme:
mi=(∑j,kαjk(i)ajk)⊗(∑j,kβjk(i)bjk)⊗(∑j,kγjk(i)cjk)
Caractéristiques clés:
Tous les coefficients α,β,γ∈{−1,−21,0,21,1} (nombres rationnels)
Type tensoriel: 16X2Y2Z2+32XYZ (16 tenseurs de rang 2×2×2, 32 de rang 1×1×1)
Les dénominateurs contiennent uniquement des puissances de 2, 4, 8
Utilisation systématique des symétries: Plutôt que par recherche par essais et erreurs, trouver la transformation isotrope en utilisant le sous-groupe stabilisateur (C2×D4)⋊C2 et des conjectures guidées par la théorie
Projection des nombres complexes aux nombres rationnels: Prouver que l'algorithme trouvé dans l'espace complexe de haute dimension peut être projeté dans un sous-espace rationnel, ce qui est un résultat non trivial
Optimisation du programme linéaire:
Utiliser l'outil PLinOpt pour générer automatiquement des programmes linéaires optimisés
Réduire le nombre d'opérations via la décomposition du noyau (kernel decomposition)
Même si les coefficients de la matrice R sont simples, le programme linéaire optimal peut nécessiter des multiplications non triviales
Méthode de base alternative: Simplifier davantage par changement de base (change of basis), réduisant les opérations à 336 (comparé aux 341 originaux)
Preuve d'existence: Prouver que dans l'orbite d'isotropie de l'algorithme AlphaEvolve existe effectivement un point rationnel, ce qui n'est pas évident
Simplicité des coefficients: Tous les coefficients sont dans {−1,−21,0,21,1}, faciles à implémenter
Paradoxe d'optimisation: Bien que les coefficients de la matrice R soient uniquement dans {−1,0,1}, le programme linéaire optimal nécessite toujours des multiplications non triviales (en raison de la décomposition du noyau)
Avantage de la base alternative: Via le changement de base, on peut réduire la constante dominante de 11.66 à 7.00, au prix d'un coût de changement de base de o(n2.792)
Fawzi et al. (2022) 5: Utiliser l'apprentissage par renforcement pour découvrir un algorithme à 47 multiplications en caractéristique 2
Kaporin (2024) 8: Utiliser les moindres carrés non linéaires pour résoudre les équations de Brent en nombres complexes
AlphaEvolve (2025) 11: Utiliser des modèles de langage de grande taille et des agents évolutifs pour découvrir un algorithme à 48 multiplications (complexe) et 63 multiplications (3×4×7)
Combler une lacune importante: Résoudre la limitation des coefficients complexes de l'algorithme AlphaEvolve, un problème pratique réel
Innovation méthodologique: Application systématique de la théorie du groupe d'isotropie, fournissant un chemin théorique des nombres complexes aux nombres rationnels
Rigueur mathématique: Basé sur la théorie de la géométrie tensorielle de Landsberg, avec des fondations algébriques solides
Implémentation complète: Fournir des programmes linéaires et des matrices LRP, directement utilisables
Reproductibilité open-source: Tous les données et codes sont disponibles publiquement dans la bibliothèque PLinOpt
Large applicabilité: Les coefficients rationnels permettent l'utilisation de l'algorithme sur les entiers, les rationnels, les corps finis (caractéristique impaire), etc.
Découverte de la transformation isotrope: Reconnaître l'utilisation de "conjectures éclairées", manque de méthode de recherche systématisée
Dépendance du sous-groupe stabilisateur: Nécessiter de connaître le sous-groupe stabilisateur (C2×D4)⋊C2, peut être difficile à obtenir pour de nouveaux problèmes
Restriction de caractéristique: Non applicable aux corps de caractéristique 2 (l'algorithme de Fawzi à 47 multiplications est au contraire applicable)
Preuve d'existence incomplète: Montrer seulement un point rationnel, sans prouver son unicité ou optimalité
Structure d'orbite non explorée: Les questions sur la position, le nombre de points rationnels dans l'orbite, etc., ne sont pas discutées
Bornes inférieures non abordées: Ne pas discuter de la borne inférieure théorique pour la multiplication de matrices 4×4 (est-il possible d'avoir <48?)
Ceci est un article de haute qualité en informatique théorique, convertissant avec succès l'algorithme du domaine complexe découvert par l'IA en algorithme du domaine rationnel, avec une importance théorique significative et une certaine valeur pratique. Les principaux avantages de l'article sont:
Résoudre un problème pratique: La limitation des coefficients complexes d'AlphaEvolve restreint la portée des applications
Méthode rigoureuse: Basée sur la théorie mature de la décomposition tensorielle et du groupe d'isotropie
Implémentation complète: Fournir une implémentation open-source reproductible
Les principales insuffisances sont:
La découverte de la transformation isotrope nécessite toujours des conjectures manuelles
Manque d'analyse de performance réelle et de stabilité numérique
Le terme constant important limite la praticité
Indice de recommandation: ⭐⭐⭐⭐ (4/5)
Recommandé pour les chercheurs intéressés par le calcul symbolique, la décomposition tensorielle et les algorithmes rapides. Pour les applications pratiques, il est nécessaire d'évaluer selon des scénarios spécifiques si cet algorithme est supérieur aux méthodes traditionnelles.