In this work, we investigate the universal representation capacity of the Matrix Product States (MPS) from the perspective of boolean functions and continuous functions. We show that MPS can accurately realize arbitrary boolean functions by providing a construction method of the corresponding MPS structure for an arbitrarily given boolean gate. Moreover, we prove that the function space of MPS with the scale-invariant sigmoidal activation is dense in the space of continuous functions defined on a compact subspace of the $n$-dimensional real coordinate space $\mathbb{R^{n}}$. We study the relation between MPS and neural networks and show that the MPS with a scale-invariant sigmoidal function is equivalent to a one-hidden-layer neural network equipped with a kernel function. We construct the equivalent neural networks for several specific MPS models and show that non-linear kernels such as the polynomial kernel which introduces the couplings between different components of the input into the model appear naturally in the equivalent neural networks. At last, we discuss the realization of the Gaussian Process (GP) with infinitely wide MPS by studying their equivalent neural networks.
- 论文ID: 2103.08277
- 标题: Representation Theorem for Matrix Product States
- 作者: Erdong Guo, David Draper (University of California, Santa Cruz)
- 分类: stat.ML cs.LG cs.NE quant-ph
- 发表时间: 2021年3月15日 (arXiv预印本)
- 论文链接: https://arxiv.org/abs/2103.08277
本文从布尔函数和连续函数的角度研究矩阵乘积态(Matrix Product States, MPS)的通用表示能力。作者证明了MPS可以精确实现任意布尔函数,并为任意给定的布尔门提供了相应MPS结构的构造方法。此外,还证明了具有尺度不变sigmoid激活函数的MPS函数空间在n维实坐标空间的紧子集上定义的连续函数空间中稠密。研究了MPS与神经网络的关系,表明带有尺度不变sigmoid函数的MPS等价于配备核函数的单隐层神经网络。最后,通过研究等价神经网络讨论了无限宽MPS实现高斯过程(GP)的问题。
- 张量网络的兴起: 张量网络作为表示多体量子系统的强大图形语言,在量子信息、凝聚态物理、应用数学和计算机科学等多个领域都得到了广泛应用。
- MPS的表示能力问题: 虽然MPS在量子物理中具有重要的物理意义,但当将其作为机器学习中的代数工具时,一个自然的问题是:MPS作为代数机器的表示能力有多强?
- 通用逼近理论的需求: 类似于神经网络的通用逼近定理,需要从理论上证明MPS的表示能力边界。
- 填补理论空白: 现有研究主要关注MPS的物理性质,缺乏对其作为函数逼近器的理论分析。
- 建立MPS与神经网络的联系: 探索MPS与经典机器学习模型(特别是神经网络)之间的等价关系。
- 实用性考量: 在实际应用中,完备基通常是无限维的,需要研究在温和假设下MPS能"张成"多大的函数空间。
- 布尔函数的精确表示: 证明了MPS可以精确实现任意布尔函数,并提供了构造性证明方法。
- 连续函数的通用逼近: 证明了带有尺度不变sigmoid激活的MPS函数空间在连续函数空间中稠密(关于上确界范数)。
- MPS与神经网络的等价性: 建立了MPS与单隐层神经网络的等价关系,揭示了核函数在MPS中的自然出现。
- 高斯过程的实现: 通过无限宽MPS讨论了高斯过程的实现问题。
原始MPS模型定义为:
Ψl(x∣w,B)=∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x)
其中核函数定义为:
Φs1⋯sn(x)=ϕs1(x1)⊗⋯⊗ϕsi(xi)⋯⊗ϕsn(xn)
为了实现通用逼近,作者提出修正的MPS结构:
Ψ(x∣w,B)=∑lσ(∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x))
其中σ(⋅)是尺度不变的sigmoid函数:
σ(x)→{0Cx→−∞x→+∞
AND门实现 (定理2.1):
- 核函数:ϕi(Xi)=[Xi,1−Xi]
- 张量节点:Asi=[1,0],键维数∣α∣=1
OR门实现 (定理2.2):
- 核函数:ϕi(Xi)=[Xi,1−Xi]
- 张量节点键维数:∣α∣=3
- 具体张量结构:
Aα1α2s1=[[1,0,1],[0,1,0]]Aα2α1s2=[[0,1,1],[1,0,0]]
NOT门实现 (定理2.3):
- 核函数:ϕ1(X1)=1−X1
- 张量节点:As1=1
通用AND门 (定理2.4):
对于n个输入变量,可以实现:
Ψ(X1,⋯,Xn)=(⋀i=1lXi)⋀(⋀j=l+1nXj)
任意布尔函数 (定理2.5):
通过将任意布尔函数表示为通用AND门的析取范式,可以构造相应的MPS。构造规则:
- 将布尔函数写成真值表对应的析取范式
- 设置键维数为析取项数量m
- 按照特定规则填充张量元素
MPS函数空间在C0(In)(单位立方体上的连续函数空间)中稠密,即对于任意f(x)∈C0(In)和任意ε>0,存在MPS函数Ψ(x)使得:
supx∣Ψ(x)−f(x)∣<ε
线性性证明 (引理3.2):
证明MPS函数族M是C0(In)的线性子空间:
- 对标量乘法封闭:利用尺度不变性
- 对加法封闭:构造新的MPS表示两个MPS之和
判别性质 (引理3.4):
证明尺度不变sigmoid函数具有判别性质:如果有限符号测度μ使得所有MPS函数的积分为0,则μ=0。
主定理证明:
使用Hahn-Banach定理和Riesz表示定理的矛盾论证:
- 假设M是C0(In)的真子集
- 由Hahn-Banach定理,存在非平凡泛函湮灭M
- 由Riesz表示定理,对应非平凡测度
- 由判别性质,该测度必须为0,产生矛盾
带有尺度不变sigmoid激活的MPS等价于配备核函数的单隐层神经网络。
通过收缩内部指标{αi},MPS可以写成:
Ψ(x)=∑lσ(∑sWslΦs(x))
这正是单隐层神经网络的形式,其中:
- Wsl是权重参数
- Φs(x)是核函数,自然引入输入分量间的耦合
通过具体例子展示了多项式核等非线性核如何在等价神经网络中自然出现,例如:
(Φs)T=[x1x2x3,x2x3,x1x3,x1x2,x1,x2,x3,1]
3输入OR门:
布尔表达式:f(X1,X2,X3)=X1∨X2∨X3
对应的MPS张量结构已在方法部分详细给出。
3输入奇偶校验门:
布尔表达式:f(X1,X2,X3)=X1⊕X2⊕X3
等价神经网络权重:Ws=[1,0,0,1,0,1,1,0]
阈值门Th₃²:
当至少2个输入为1时输出1的阈值函数。
对于n输入布尔门,在极端情况下键维数需要O(2n),但通过卡诺图简化可以降低到O(2n−1),参数总数为O(n2n−1),与单隐层神经网络效率相当。
- Penrose (1971)的张量计算图形符号系统
- Vidal (2003, 2007)的Schmidt分解和DMRG方法
- Perez-Garcia等(2006)对MPS性质的系统研究
- Stoudenmire & Schwab (2016)的监督学习应用
- 各种张量网络在回归、分类和密度估计中的应用
- Cybenko (1989), Hornik (1991)关于神经网络通用逼近性的经典工作
- 本文采用类似的泛函分析技术
- 理论完备性: MPS具有表示任意布尔函数和逼近任意连续函数的能力
- 等价性揭示: MPS本质上等价于带核函数的单隐层神经网络
- 核函数重要性: 核函数Φs1⋯sn是MPS表示能力的关键,而非键指标{αi}
- 实用性问题: 布尔函数的MPS实现需要指数级的键维数
- 物理意义丢失: 作为纯代数工具时,MPS失去了量子物理中的纠缠等重要性质
- 核函数设计: 需要精心设计核函数来获得足够的表示能力
- 高效构造方法: 寻找更高效的MPS构造方法,降低复杂度
- 深层结构: 探索多层MPS结构,类比深度神经网络
- 量子优势: 在量子计算环境下探索MPS的独特优势
- 理论贡献重大: 首次从函数逼近角度系统分析MPS的表示能力
- 证明严谨: 使用泛函分析的经典工具,证明过程严密
- 连接性洞察: 揭示了MPS与神经网络的深层联系,为跨领域理解提供了桥梁
- 构造性证明: 不仅证明了存在性,还提供了具体的构造方法
- 实用性有限: 理论结果在实际应用中可能面临维数灾难
- 实验验证不足: 缺乏大规模数值实验验证理论结果
- 优化算法缺失: 未讨论如何高效地训练这样的MPS模型
- 比较分析不够: 与其他通用逼近器的详细比较分析不足
- 理论价值高: 为张量网络在机器学习中的应用提供了坚实的理论基础
- 跨领域意义: 连接了量子物理和机器学习两个领域
- 启发性强: 为后续研究张量网络的表示能力和优化方法提供了重要参考
- 理论研究: 适合作为张量网络表示理论的基础文献
- 教学用途: 可用于解释MPS与神经网络的关系
- 算法设计: 为设计基于MPS的机器学习算法提供理论指导
- 量子机器学习: 为量子机器学习算法的设计提供理论支撑
本文引用了张量网络、量子信息、机器学习和泛函分析等多个领域的重要文献,包括:
- 张量网络基础理论 (Penrose, 1971; Vidal, 2007; Perez-Garcia et al., 2006)
- 神经网络通用逼近理论 (Cybenko, 1989; Hornik, 1991)
- 张量网络在机器学习中的应用 (Stoudenmire & Schwab, 2016; 等)
- 泛函分析理论基础 (Folland, 2013)