We study the algorithmic problem of multiplying large matrices that are rectangular. We prove that the method that has been used to construct the fastest algorithms for rectangular matrix multiplication cannot give algorithms with complexity $n^{p + 1}$ for $n \times n$ by $n \times n^p$ matrix multiplication. In fact, we prove a precise numerical barrier for this method. Our barrier improves the previously known barriers, both in the numerical sense, as well as in its generality. In particular, we prove that any lower bound on the dual exponent of matrix multiplication $α$ via the big Coppersmith-Winograd tensors cannot exceed 0.6218.
- 论文ID: 2003.03019
- 标题: Barriers for rectangular matrix multiplication
- 作者: Matthias Christandl, François Le Gall, Vladimir Lysikov, Jeroen Zuiddam
- 分类: cs.CC (Computational Complexity), math.AC (Commutative Algebra)
- 发表时间: November 10, 2025 (arXiv版本)
- 论文链接: https://arxiv.org/abs/2003.03019
本文研究了大型矩形矩阵乘法的算法问题。作者证明了用于构造最快矩形矩阵乘法算法的方法无法为 n×n 乘以 n×np 的矩阵乘法提供复杂度为 np+1 的算法。实际上,作者为这种方法证明了精确的数值障碍。这一障碍在数值意义和通用性方面都改进了之前已知的障碍。特别地,作者证明了通过大Coppersmith-Winograd张量获得的矩阵乘法对偶指数 α 的任何下界都不能超过0.6218。
- 矩阵乘法复杂性问题:给定两个大矩阵,需要多少标量算术运算来计算它们的矩阵乘积?标准算法对于两个 n×n 方阵需要约 2n3 次运算,但理论下界仅为 n2。
- 矩形矩阵乘法:在实际应用中,待乘矩阵通常是矩形而非方阵。对于任意非负实数 p,给定 n×⌈np⌉ 矩阵和 ⌈np⌉×n 矩阵,需要多少运算来计算其乘积?
- 指数定义:ω(p) 表示任何算术算法所需运算次数中 n 的最优指数,先验边界为 max(2,1+p)≤ω(p)≤2+p。
- 理论重要性:理解 ω(p) 不仅对矩形矩阵乘法有意义,也是证明 ω=2(方阵乘法的最优指数)的手段。
- 实际应用:矩形矩阵乘法在线性规划求解、经验风险最小化等领域有直接应用。
- 技术局限:当前技术在改进上界方面遇到瓶颈,需要理解其根本限制。
- 建立了通用障碍框架:为当前构造矩形矩阵乘法算法的主要技术建立了精确的数值障碍。
- 改进了数值界限:在数值意义和通用性方面都改进了之前的障碍结果。
- 引入虚拟矩阵乘法张量:为处理非整数 p 的情况,引入了新的数学工具。
- 分析催化性方法:研究了包含催化张量的更复杂算法结构。
- 对偶指数的精确界限:证明了通过Coppersmith-Winograd张量获得的 α 下界不能超过0.6218。
研究矩形矩阵乘法问题:给定 n×⌈np⌉ 矩阵 A 和 ⌈np⌉×n 矩阵 B,计算乘积 AB 所需的算术运算次数。目标是理解当前技术在改进复杂度上界 ω(p) 方面的根本限制。
矩阵乘法问题对应于张量族:
- ℓ×m 矩阵乘以 m×n 矩阵对应张量:⟨ℓ,m,n⟩=∑i=1ℓ∑j=1m∑k=1nxijyjkzki
- 单位问题对应对角张量:⟨n⟩=∑i=1nxiyizi
定义了多种张量约化类型:
- 限制 (S≤T):存在线性映射使得 S=T∘(A,B,C)
- 退化 (S◃T):S=limϵ→0T(A(ϵ)x,B(ϵ)y,C(ϵ)z)
- 单项式限制/退化:矩阵 A,B,C 每行每列最多一个非零元素
定义了适当张量参数类 F,需满足:
- ≤-单调性:S≤T⇒F(S)≤F(T)
- ⊗-次乘性:F(S⊗T)≤F(S)⋅F(T)
- MaMu-⊗-乘性:F(⟨ℓ1ℓ2,m1m2,n1n2⟩)=F(⟨ℓ1,m1,n1⟩)⋅F(⟨ℓ2,m2,n2⟩)
- 自⊕-加性:F(T⊕s)=s⋅F(T)
- 渐近秩界限:F(T)≤R~(T)
为处理实数 p,引入形式符号 ⟨2,2,2p⟩:
- 当 p=logab(a,b 为正整数)时:F(⟨2,2,2p⟩)=2logaF(⟨a,a,b⟩)
- 否则通过下确界定义:F(⟨2,2,2p⟩)=inf{F(⟨2,2,2P⟩)∣P≥p,∃a,b∈Z≥0:P=logab}
通过将适当参数 F,G 应用于算法链的两端:
⟨n,n,m⟩⊕s≤T⊗k≤⟨r⟩⊗kb
得到:
logF(T)logF(⟨2,2,2p⟩)logR~(T)≤ω(p)
使用Strassen的上支撑泛函作为适当参数:
ζθ(T)=minS≅TmaxP∈P(supp(S))2∑i∈[3]θiH(Pi)
其中 θ=(θ1,θ2,θ3)∈P([3]),H 为Shannon熵。
分析CW张量:
CWq(x,y,z)=x0y0zq+1+x0yq+1z0+xq+1y0z0+∑i=1q(x0yizi+xiy0zi+xiyiz0)
已知 R~(CWq)=q+2。
障碍计算转化为凸优化问题:
maxθmaxP∑i=13θiH(Pi)2θ1+(p+1)(θ2+θ3)log2(q+2)
对于 CWq 张量,ω(2) 的障碍值:
| q | ω(2)≥ | 最优 θ1 |
|---|
| 2 | 3.0626 | 0.096 |
| 6 | 3.1039 | 0.136 |
| 10 | 3.1409 | 0.165 |
| 14 | 3.1714 | 0.185 |
| q | α 障碍 |
|---|
| 2 | 0.6218 |
| 6 | 0.5408 |
| 10 | 0.4914 |
| 14 | 0.4529 |
关键结果:任何通过 CWq(对任意 q)的退化获得的 α 下界都不能超过 0.6218。
- Alman-Vassilevska Williams AW18a:单项式退化通过 CW6 只能给出 α≥0.871
- 本文:更强的退化通过 CW6 只能给出 α≥0.543
- 当前最佳下界:α>0.321334 WXXZ24
对于 κ-催化方法,障碍增强为:
ω(p)≥logF(T)logF(⟨2,2,2p⟩)logR~(T)+κ(logF(T)logR~(T)−1)
- Ambainis-Filmus-Le Gall AFLG15:首次在矩阵乘法中证明障碍,显示某些方法无法达到 ω=2。
- Alman-Vassilevska Williams AW18a,AW18b:
- 扩展到单项式退化
- 首次研究矩形矩阵乘法障碍
- 基于渐近独立数分析
- Blasiak等 BCC+17a,BCC+17b:研究群论方法的障碍。
- Christandl-Vrana-Zuiddam CVZ19:
- 更一般的退化障碍
- 基于张量的不可逆性
- 使用量子泛函和支撑泛函
- 更高的数值界限:相比之前工作得到更紧的障碍
- 更广的适用范围:不仅适用于 0≤p≤1,也适用于 p≥1
- 统一框架:涵盖所有已知的约化概念
- 混合方法分析:首次系统分析混合中间张量方法
- 根本限制:当前主流技术(基于Coppersmith-Winograd张量的退化方法)在改进矩形矩阵乘法复杂度方面存在根本限制。
- 精确数值界限:通过任何 CWq 张量获得的对偶指数 α 下界不能超过0.6218,远低于理论最大值1。
- 技术瓶颈:证明了为什么当前技术无法显著缩小 ω(p) 上下界之间的差距。
- 方法特定性:障碍仅适用于基于特定中间张量(如CW张量)的方法,不排除其他可能的算法设计思路。
- 下界性质:这些是方法论障碍而非问题本身的下界,不排除存在更好的算法。
- 计算复杂性:数值计算依赖凸优化,对于更大的张量可能面临计算挑战。
- 新的中间张量:寻找不受当前障碍限制的新型中间张量。
- 非张量方法:探索不基于张量退化的全新算法设计范式。
- 障碍的紧性:研究所证明的障碍是否是紧的。
- 其他约化类型:分析更一般约化概念下的障碍。
- 理论深度:建立了完整的障碍理论框架,数学严谨性高。
- 技术创新:
- 虚拟矩阵乘法张量的引入巧妙地处理了非整数指数问题
- 适当张量参数的抽象化提供了统一的分析工具
- 实用价值:精确的数值结果为算法设计者提供了明确的技术限制指导。
- 全面性:涵盖了从基础理论到具体计算的完整链条。
- 障碍的局限性:仅适用于特定类型的算法,可能存在绕过这些障碍的方法。
- 计算依赖:数值结果依赖于支撑泛函的计算,对于更复杂张量可能难以处理。
- 间隙分析:虽然证明了障碍,但未深入分析障碍与当前最佳结果之间的差距意味着什么。
- 理论贡献:为复杂性理论提供了新的分析工具和视角。
- 实际指导:帮助研究者理解当前技术的限制,指导未来研究方向。
- 方法论价值:障碍分析框架可能适用于其他算法设计问题。
- 算法设计:为矩阵乘法算法设计者提供理论指导。
- 复杂性分析:为其他代数问题的障碍分析提供方法论参考。
- 优化理论:在需要理解算法根本限制的场景中具有应用价值。
主要相关工作包括:
- AFLG15 Ambainis, Filmus, Le Gall: Fast matrix multiplication limitations
- AW18a Alman, Vassilevska Williams: Further limitations of known approaches
- CVZ19 Christandl, Vrana, Zuiddam: Barriers from irreversibility
- CW90 Coppersmith, Winograd: Matrix multiplication via arithmetic progressions
- Str91 Strassen: Degeneration and complexity of bilinear maps