2025-11-20T01:58:13.620361

Improved contraction of finite projected entangled pair states

Scheb
We present an improved version of the algorithm contracting and optimizing finite projected entangled pair states (fPEPS) in conjunction with projected entangled pair operators (PEPOs). Our work has two components to it. First, we explain in detail the characteristic contraction patterns that occur in fPEPS calculations and how to slice them such that peak memory occupation remains minimal while ensuring efficient parallel computation. Second, we combine controlled bond expansion [A. Gleis, J.-W. Li, and J. von Delft, Phys. Rev. Lett. 130, 246402 (2023)] with randomized singular value decomposition [V. Rokhlin, A. Szlam, and M. Tygert, SIAM J. Matrix Anal. Appl. (2009)] and apply it throughout the fPEPS algorithm. We present benchmark results for the Hubbard model for system sizes up to 8x8 and SU(2) symmetric bond dimension of up to D = 6 for PEPS bonds and $χ$ = 500 for the environment bonds. Finally, we comment on the state and future of the fPEPS-PEPO framework.
academic

Improved contraction of finite projected entangled pair states

基本信息

  • 论文ID: 2511.01039
  • 标题: Improved contraction of finite projected entangled pair states
  • 作者: Markus Scheb (Ludwig-Maximilians-University Munich)
  • 分类: cond-mat.str-el (强关联电子系统)
  • 发表时间: November 4, 2025
  • 论文链接: https://arxiv.org/abs/2511.01039

摘要

本文提出了一种改进的有限投影纠缠对态(fPEPS)与投影纠缠对算符(PEPO)的收缩和优化算法。工作包含两个核心组成部分:(1)详细解释fPEPS计算中出现的特征收缩模式,以及如何对其进行切片以最小化峰值内存占用并确保高效并行计算;(2)将控制键扩展(CBE)与随机奇异值分解(RSVD)相结合,并应用于整个fPEPS算法。文章针对Hubbard模型展示了高达8×8系统尺寸、SU(2)对称键维度D=6(PEPS键)和χ=500(环境键)的基准测试结果。

研究背景与动机

核心问题

二维量子多体系统的数值模拟是凝聚态物理中的核心挑战。虽然一维系统可以通过密度矩阵重整化群(DMRG)和矩阵乘积态(MPS)高效处理,但二维系统的自然推广——投影纠缠对态(PEPS)面临着严重的计算困难。

问题重要性

  1. 基础物理研究:理解高温超导、量子自旋液体等强关联现象需要精确模拟二维量子系统
  2. 方法学挑战:PEPS由于其环状结构导致张量收缩成本呈指数增长,期望值无法精确计算,变分优化收敛性差
  3. 实用性需求:需要能够处理大尺寸、非均匀、开边界条件的二维量子系统的无偏算法

现有方法局限性

  1. 无限PEPS (iPEPS):仅限于小单元胞,无法处理大尺寸非均匀系统
  2. 等距张量网络:虽然易于处理,但限于特殊相态(如弦网液体)
  3. 先前的fPEPS实现:环境键维度χ较低(250-350),导致数值不稳定和收敛性差,能量误差较大

研究动机

作者在前期工作Ref. 31基础上,针对fPEPS算法的两个主要瓶颈进行改进:

  1. 内存瓶颈:张量收缩产生的中间结果尺寸达到O(χ²(DwD)²),远超其他存储张量
  2. 计算效率:键优化的2s算法成本过高,需要更高效的1s成本方法

核心贡献

  1. 最优收缩序列设计:详细阐述了fPEPS中两种主导收缩模式的最优处理方法,通过量子数映射和切片技术将峰值内存降至最低,同时保证并行计算效率
  2. CBE-RSVD融合框架:首次将控制键扩展(CBE)与随机奇异值分解(RSVD)相结合,应用于环境近似和能量最小化,将计算成本从2s降至1s
  3. 更高保真度模拟:将环境键维度从χ=250-350提升至χ=500,在Hubbard模型上实现:
    • 4×4晶格:相对能量误差<1%(一个超扫描周期)
    • 6×6晶格:误差从6.8%降至4.7%
    • 8×8晶格:误差从16%降至11%,运行时间从21天降至8天
  4. 实用性验证:展示了1/8填充8×8 Hubbard模型的条纹结构和反铁磁序,验证了算法的物理可靠性

方法详解

任务定义

输入

  • 二维晶格哈密顿量H(通过PEPO表示,键维度w)
  • 初始PEPS波函数|ψ⟩(键维度D)
  • 环境键维度χ

输出

  • 优化后的PEPS基态波函数
  • 基态能量E = ⟨ψ|H|ψ⟩

约束

  • 开边界条件
  • 保持U(1)或SU(2)对称性
  • 控制计算成本和内存占用

核心架构:fPEPS-PEPO框架

1. 能量泛函表示

如图1所示,能量泛函表示为三层夹心结构:

  • PEPS层:黑色键连接相邻张量,维度D
  • PEPO层:蓝色键表示哈密顿量,维度w
  • 共轭PEPS层:绿色键连接物理希尔伯特空间,维度d

2. 环境近似

由于环路导致精确计算成本指数增长,采用环境近似:将三条键的束(总维度DwD)逐步压缩到累积键维度χ。实际模拟中χ ≫ D,w,d。

3. 优化方案

  • 局部更新:扫描晶格优化单个张量及相邻键
  • 梯度更新:同时优化所有PEPS张量,保持键基不变
  • 超扫描:交替进行3次局部扫描和100次梯度扫描

技术创新点

创新1:最优收缩序列(第III节)

问题:两种主导收缩模式(图2)直接计算产生O(χ²(DwD)²)的巨大中间结果

解决方案:量子数切片策略

  1. 预处理阶段
    • 计算并存储夹心张量C(PEPS-PEPO-PEPS)
    • 扫描C,建立量子数映射:{(q_t, q_l)}_i → {(q_b, q_r)}_i
    • 为环境张量T,L,B,R建立量子数到稠密块的映射
  2. 收缩执行
    • 嵌套循环遍历(i, q_tr, q_bl)
    • 计算((T·L)·C)·B(环境近似)或((T·L)·C)·(B·R)(有效哈密顿量作用)
    • 不同(i, q_tr, q_bl)的收缩互不重叠,天然并行

优势

  • 避免生成巨大中间张量
  • 峰值内存最小化
  • 完美并行化,无速度损失

创新2:CBE-RSVD融合(第IV节)

背景:键优化出现在两个阶段:

  1. 环境近似(类似MPS压缩)
  2. 能量最小化(类似DMRG)

传统CBE问题

  • 需要收缩和分解整个大簇(图3),成本等同于2s优化
  • "精明选择"策略虽可降低成本,但仍不够高效

RSVD加速: 对于(χDwD)×(χDwD)的低秩矩阵A:

  1. 生成(χDwD)×χ̃的高斯随机矩阵Ω(χ̃ ≪ χ)
  2. 通过A和A^T反复作用于Ω提取主导子空间
  3. 在fPEPS中,单次AΩ操作即足够

环境近似的AΩ操作(图5):

  • 最昂贵收缩成本:O(χ̃χ²(DwD)²)
  • 关键技巧:将正交投影器分解为单位算符和切向投影器
  • 避免显式计算维度χ̄的张量腿

能量最小化的AΩ操作(图7):

  • PEPS张量经过加权迹规范
  • χ ≫ D允许直接计算PEPS正交投影器
  • 按图2(b)结构收缩Heff|ψ⟩

实测效果

  • 4×4晶格,SU(2) D=6:从4天150GB(χ=300)降至5天26GB(χ=500)
  • 内存占用降低83%,同时提高保真度

数学细节

完备性关系(图4): 1=Pkept+Pdiscarded\mathbb{1} = P_{\text{kept}} + P_{\text{discarded}}

其中χ和χ̄分别是保留空间和丢弃空间的维度。

CBE目标:在键维度χ下,最大化新环境与旧环境及PEPS-PEPO-PEPS夹心的重叠,输出截断补空间(丢弃空间中最重要的状态)。

实验设置

测试模型:二维Hubbard模型

哈密顿量: H=ti,j,σ(ciσcjσ+h.c.)+UininiH = -t\sum_{\langle i,j\rangle,\sigma}(c_{i\sigma}^\dagger c_{j\sigma} + \text{h.c.}) + U\sum_i n_{i\uparrow}n_{i\downarrow}

参数配置

  • 相互作用强度:U = 8
  • 跳跃:仅最近邻
  • 边界条件:开边界
  • 填充
    • 4×4和6×6:半填充(16和36电子)
    • 8×8:1/8填充(56电子,诱导条纹结构)

对称性方案

  1. U(1)_spin ⊗ U(1)_charge:D = 4-8
  2. SU(2)_spin ⊗ U(1)_charge:D = 4-6

优化策略

  • 超扫描:3次局部扫描 + 100次梯度扫描
  • 环境键维度:χ = 500(前作为250-400)
  • 基准:DMRG计算(D=4000)的能量E_0
    • 4×4:精确基态能量
    • 6×6和8×8:能量上界

计算资源

  • 运行时间:数天至两周
  • 内存:26GB-150GB
  • 并行化:利用量子数切片的天然并行性

实验结果

主要结果

1. 4×4晶格(图8)

变分行为

  • 能量随键维度增加而降低
  • 曲线在超扫描增加时趋于平坦

关键改进(对比Ref. 31图38):

  • (SU(2), D=4):现在介于(U(1), D=6)和(U(1), D=7)之间,而非收敛到(U(1), D=5)
  • 第二超扫描初期陡降:表明首批梯度扫描后,局部扫描优化虚拟基是必要的
  • (SU(2), D=6):一个超扫描后突破1%误差(前作两个超扫描仍>1%)

χ影响

  • χ=500 vs 250-350:显著改善收敛性
  • 过低的χ不仅导致数值不稳定,还会以难以察觉的方式扭曲收敛

性能

  • (SU(2), D=6):5天,26GB(χ=500,1.5超扫描)
  • 前作:4天,150GB(χ=300,2超扫描)

2. 6×6晶格(图9)

变分行为:由于系统更大,超扫描数更少但仍显示清晰变分特性

数值稳定性

  • 大键维度模拟提前终止(数值不稳定)
  • 即使有计算改进,更高χ的重新运行仍不可行
  • (U(1), D=7)末期临时增长:暂时不稳定但随后恢复

突破性进展

  • 首次完成**(U(1), D=8)**模拟
  • 初期与(U(1), D=7)相近,第二超扫描显著更低

最佳结果

  • 前作:6.8%(SU(2), D=6)
  • 本文:4.7%,更高保真度(χ=500),运行时间减半

3. 8×8晶格(图10)

挑战

  • SU(2)模拟数据点稀少(数值不稳定或运行时间>2周)
  • 与4×4和6×6不同,最低能量来自U(1)模拟

最佳性能

  • (U(1), D=8):一个完整超扫描后达到11%相对误差,8天
  • 前作:16%误差,半个超扫描,21天
  • 改进:误差降低31%,速度提升62%

物理结果分析

U(1)对称性局域密度(图11)

条纹结构(1/8填充):

  • 振荡电荷密度的经典条纹模式
  • 不可公度反铁磁序
  • 顶部/底部:边缘中心条纹
  • 中部:似乎是格点中心条纹

局限性:算法远未收敛,无法确定这是物理真实还是数值假象

SU(2)对称性局域密度(图12)

  • S_z分量构造性为零,反铁磁序被抑制
  • 显示总自旋分量
  • 电荷密度呈现类似条纹结构
  • 相比Ref. 31,分布更对称(定性改进)
  • 仍需更多超扫描以获得可靠物理图像

消融实验

虽然论文未明确标注消融实验,但通过对比不同配置隐含验证了各组件贡献:

  1. χ值影响(χ=500 vs 250-350):
    • 4×4:收敛路径显著改变,能量误差改善
    • 证明环境键维度是关键参数
  2. 对称性方案(U(1) vs SU(2)):
    • 小系统:SU(2)更高效(相同精度更低D)
    • 大系统:U(1)更稳定(8×8)
    • 揭示对称性与数值稳定性的权衡
  3. 局部/梯度扫描比例
    • 第二超扫描初期陡降表明3:100比例可能非最优
    • 建议未来工作重新审视此比例

相关工作

张量网络方法谱系

一维方法

  1. DMRG White 1992-1993:密度矩阵重整化群,一维系统的黄金标准
  2. MPS Rommer & Östlund 1997:DMRG的张量网络表述,存在正则规范

二维PEPS变体

  1. iPEPS Jordan et al. 2008
    • 无限PEPS,成功应用于多种二维模型
    • 局限:小单元胞
    • 代表性工作:Corboz的变分优化,Hubbard模型能量外推
  2. 等距张量网络 Zaletel & Pollmann 2020
    • 虚拟键上施加幺正性
    • 易于处理但限于特殊相(弦网液体)
  3. 高斯PEPS Emonts & Zohar 2023
    • 应用于晶格规范理论、d波超导、U(1) Dirac自旋液体
  4. PEPS-Monte Carlo混合 Vieijra et al. 2021
    • 直接采样PEPS,更高效收缩但引入统计误差
    • Liu et al. 2025:Hubbard模型的精确模拟
  5. 信念传播 Tindall & Fishman 2023
    • 尝试规范化循环张量网络
    • 环路级数展开 Evenbly et al. 2024:重新引入被忽略的贡献

本文定位

  • 回归原始fPEPS理念:无规范约束的开边界条件
  • 理论上能描述大型、非均匀二维量子系统的完整物理行为
  • 与iPEPS(小单元胞)和等距网络(特殊规范)互补

技术继承

  1. 控制键扩展(CBE) Gleis et al. 2023:1s成本优化键
  2. 随机SVD Rokhlin et al. 2009; Halko et al. 2011:低秩矩阵快速分解
  3. 加权迹规范 Evenbly 2018:构造PEPS正交投影器

结论与讨论

主要结论

  1. 技术突破
    • 量子数切片策略实现内存最优、完美并行的收缩
    • CBE-RSVD融合将键优化成本从2s降至1s
    • 环境键维度χ从350提升至500
  2. 性能提升(相比Ref. 31):
    • 4×4:能量误差<1%,内存降低83%
    • 6×6:误差从6.8%降至4.7%,速度翻倍
    • 8×8:误差从16%降至11%,速度提升62%
  3. 物理验证
    • 成功复现Hubbard模型1/8填充的条纹结构
    • 观察到边缘中心与格点中心条纹的共存

局限性

1. 竞争力不足

关键评估(作者自述):

"即使有这些改进,能量仍远未接近DMRG提供的上界,意味着目前形式的fPEPS-PEPO方案仍不是计算二维量子系统的竞争性工具"

具体表现

  • 6×6晶格:最佳误差4.7%(vs DMRG上界)
  • 8×8晶格:误差11%,且远未收敛
  • 大键维度时数值不稳定

2. 数值稳定性问题

  • 6×6和8×8的大D模拟频繁提前终止
  • SU(2)在8×8上尤其不稳定
  • 即使χ=500,仍不足以保证稳定性

3. 收敛速度慢

  • 8×8需要数周才能获得有限数据点
  • 局部/梯度扫描比例可能非最优
  • 第二超扫描初期陡降表明优化策略需调整

4. 物理可靠性存疑

  • 8×8的条纹结构可能是数值假象
  • 需要更多超扫描才能得出可靠物理结论

未来方向

1. 与其他方法融合

Monte Carlo混合 Vieijra et al. 2021; Liu et al. 2025

  • 更高效的张量收缩
  • 代价:引入统计误差
  • 潜力:Liu等在Hubbard模型上的成功

信念传播 Tindall & Fishman 2023

  • 尝试规范化循环网络
  • 不保证收敛到最优波函数
  • 环路级数展开 Evenbly et al. 2024可补偿被忽略贡献

2. 算法优化

  • 重新审视局部/梯度扫描比例
  • 探索自适应χ调整策略
  • 改进数值稳定性(更好的正则化、预条件)

3. 开放性问题

作者提出根本性疑问:

"这些或其他潜在的新改进是否会带来突破,以及fPEPS是否具有描述任意大型、非均匀二维量子系统的实际能力,仍是悬而未决的问题"

深度评价

优点

1. 技术创新扎实

  • 量子数切片:优雅解决内存瓶颈,理论分析清晰(图5、图7)
  • CBE-RSVD融合:将两个成熟技术有机结合,实测效果显著
  • 实现细节完整:提供足够信息供他人复现

2. 诚实的科学态度

  • 明确指出方法当前不具竞争力
  • 客观分析数值不稳定性
  • 对物理结果的可靠性持谨慎态度
  • 罕见的学术诚信典范

3. 系统性基准测试

  • 三个尺寸(4×4, 6×6, 8×8)
  • 两种对称性(U(1), SU(2))
  • 多个键维度
  • 与前作详细对比,突出改进

4. 可视化清晰

  • 大量张量网络图(图1-7)直观展示算法
  • 收敛曲线(图8-10)清楚呈现性能
  • 物理结果可视化(图11-12)

不足

1. 根本性能差距

  • 与DMRG差距巨大(6×6误差4.7%,8×8误差11%)
  • 计算成本高(8×8需8天仅得11%误差)
  • 未能证明fPEPS在实际应用中的价值

2. 数值稳定性未解决

  • 大D模拟频繁失败
  • χ=500仍不足够
  • 缺乏对不稳定性根源的深入分析

3. 实验设计局限

  • 缺乏系统性消融:未单独测试切片策略和RSVD的贡献
  • 单一模型:仅测试Hubbard模型,泛化性未知
  • 超参数探索不足:局部/梯度扫描比例未优化

4. 理论分析不足

  • 为何χ=500比350有质的改善?缺乏理论解释
  • 何时数值不稳定会发生?无预测指标
  • 最优收缩序列是否真正最优?无复杂度分析证明

5. 与最新工作对比缺失

  • Liu et al. 2025的PEPS-MC在Hubbard模型上表现如何?
  • 信念传播方法的实际效果?
  • 缺乏与这些新方法的直接比较

影响力评估

对领域的贡献

短期影响(中等)

  • 为fPEPS社区提供两个实用技术改进
  • 量子数切片策略可能被其他张量网络方法借鉴
  • CBE-RSVD融合框架具有通用性

长期影响(不确定)

  • 取决于fPEPS方法是否能最终实现突破
  • 作者自己对此持怀疑态度
  • 可能更多作为"如何不做"的教训

实用价值

当前(有限)

  • 对需要开边界、非均匀系统的小规模研究有用
  • 4×4可达<1%误差,适合方法学验证
  • 6×6以上实用性存疑

潜在(待验证)

  • 与MC或BP结合后可能改观
  • 作为更复杂混合方法的组件

可复现性

优点

  • 算法描述详细,图示清晰
  • 提供具体超参数
  • 前作Ref. 31提供更多实现细节

缺点

  • 未开源代码
  • 对称性实现细节不足
  • 数值稳定性处理未充分说明

适用场景

推荐场景

  1. 方法学研究
    • 测试新的张量网络技术
    • 作为更复杂方法的基准
    • 小尺寸(≤4×4)精确验证
  2. 特定物理问题
    • 需要开边界条件(iPEPS不适用)
    • 非均匀系统(如杂质、边缘态)
    • 定性物理图像(可容忍数%误差)
  3. 教学用途
    • 理解PEPS收缩的复杂性
    • 学习量子数对称性利用
    • 张量网络算法设计案例

不推荐场景

  1. 高精度需求:DMRG或QMC更合适
  2. 大尺寸周期系统:iPEPS更高效
  3. 生产级计算:当前版本不够稳定和高效

方法论启示

成功经验

  1. 分而治之:将大问题分解为可管理的子问题(量子数切片)
  2. 技术融合:组合现有方法创造协同效应(CBE+RSVD)
  3. 渐进改进:在前作基础上系统性提升

失败教训

  1. 根本瓶颈未突破:技术改进未触及PEPS的核心困难(环路、非正则性)
  2. 数值稳定性被低估:χ的重要性直到对比才显现
  3. 性能评估滞后:算法设计时未充分考虑实际应用需求

参考文献(关键文献)

  1. 31 Scheb & Noack, PRB 2023:本文的直接前作,fPEPS-PEPO框架的详细描述
  2. 32 Gleis et al., PRL 2023:控制键扩展(CBE)的原始提出
  3. 33-34 Rokhlin et al. 2009; Halko et al. 2011:随机奇异值分解(RSVD)的理论基础
  4. 36 McCulloch & Osborne 2024:对CBE的评论,可能提到RSVD应用
  5. 40 Liu et al., PRL 2025:PEPS-MC混合方法在Hubbard模型上的最新进展
  6. 41-42 Tindall & Fishman 2023; Evenbly et al. 2024:信念传播和环路级数展开

总结性评论

这是一篇技术扎实但现实残酷的论文。作者在算法工程层面做出了实质性改进(内存降低83%,速度提升62%),但诚实地承认这些改进仍不足以使fPEPS成为实用工具。这种科学诚信值得称赞,但也揭示了二维量子多体问题的深刻困难。

论文的价值更多在于方法学贡献(量子数切片、CBE-RSVD融合)和对领域现状的清醒认识,而非解决实际物理问题。它为后续研究者提供了有用的技术工具和现实的期望基准,但也暗示fPEPS可能需要与其他方法(MC、BP)深度融合才能实现突破。

对于凝聚态理论研究者,这篇论文是理解PEPS方法挑战的优秀教材;对于算法开发者,它展示了如何系统性改进复杂算法;但对于需要可靠数值结果的物理学家,它坦诚地建议:目前请使用DMRG或QMC