Partial differential equation (PDE) is an important math tool in science and engineering. This paper experimentally demonstrates an optical neural PDE solver by leveraging the back-propagation-free on-photonic-chip training of physics-informed neural networks.
- 论文ID: 2501.00742
- 标题: Experimental Demonstration of an Optical Neural PDE Solver via On-Chip PINN Training
- 作者: Yequan Zhao, Xian Xiao, Antoine Descos, Yuan Yuan, Xinling Yu, Geza Kurczveil, Marco Fiorentino, Zheng Zhang, Raymond G. Beausoleil
- 分类: cs.LG cs.AR physics.optics
- 发表时间: 2025年1月1日
- 论文链接: https://arxiv.org/abs/2501.00742
偏微分方程(PDE)是科学和工程中的重要数学工具。本文通过利用物理信息神经网络(PINN)的无反向传播光子芯片训练,实验演示了一个光学神经PDE求解器。
偏微分方程求解在科学和工程中具有重要地位,传统的离散化求解方法(如有限差分法、有限元法)需要大量的数字计算资源和运行时间。物理信息神经网络(PINN)提供了一种无离散化的无监督方法,但当前的PINN训练通常需要在强大的GPU上运行数小时到数十小时。
PDE广泛应用于:
- 电磁建模和IC芯片热分析
- 医学成像
- 自主系统安全验证
等关键领域,因此需要高效的实时求解方案。
- 传统数值方法:计算资源需求大,运行时间长
- 基于GPU的PINN训练:能耗高,不适合边缘设备部署
- 光学神经网络的反向传播训练:需要额外的存储器和光子硬件实现反向计算图,需要完全可微的神经网络模型
光学神经网络(ONN)提供了高吞吐量、低能耗、低延迟和高并行性的解决方案,但在光子芯片上训练PINN面临重大挑战,特别是反向传播的实现困难。
- 首次实验演示了基于无反向传播光子芯片训练的光学神经PDE求解器
- 提出了零阶优化方法,解决了光学神经网络不可微的问题,无需校准过程
- 实现了1×4微环谐振器(MRR)权重组的芯片级PINN训练
- 验证了概念可行性,在一维热方程求解上达到5E-3的ℓ2误差
本文研究在光子芯片上训练PINN求解偏微分方程的任务。具体以一维热方程为例:
- PDE: ∂u/∂t = (1/π²)∂²u/∂x²
- 初始条件: u(x,0) = sin(πx)
- 边界条件: u(0,t) = 0; u(1,t) = 0
- 目标: 学习神经网络参数θ使得û(x,t) = f_θ(x,t)逼近真实解u(x,t)
- 网络结构:前馈神经网络,包含两个隐藏层
- 权重矩阵规模:2×4, 4×4, 4×4, 4×1
- 损失函数:L = L_r + L_0 + L_b
- L_r:PDE残差损失
- L_0:初始条件损失
- L_b:边界条件损失
- 1×4 MRR权重组:利用波分复用(WDM)技术
- 时分复用:通过不同时钟周期计算不同权重矩阵
- 权重编码:通过热调谐电压控制MRR权重值(0到1范围)
传统反向传播方法:
- ∂L/∂θ = (∂L/∂f)(∂f/∂θ)
- 需要可微的神经网络模型
- 需要额外的反向计算硬件
零阶优化方法:
- 梯度估计:∂L/∂θ ≈ (L⁺ - L⁻)/(2μ)
- 仅需前向传播
- 将光学神经网络视为黑盒
空间导数:∂²û/∂x² = (û₊ + û₋ - 2û)/(2μ)
时间导数:∂û/∂t = (û₊ - û₋)/(2μ)
其中û₊, û₋分别对应输入加减扰动δ后的网络输出。
- 直接优化光子器件的可调参数(电压值)
- 制造误差和环境噪声可在训练过程中自动缓解
- 无需预先校准过程
- 芯片:AMF代工厂制造的1×4 MRR权重组芯片
- 激光器:可调谐激光器
- 探测器:光电探测器
- 控制:四个电压源进行热调谐
- 输入维度:2 (空间坐标x和时间坐标t)
- 隐藏层:2层,每层4个神经元
- 输出维度:1 (PDE解û)
- 激活函数:σ (sigmoid)
- ℓ2误差:在测试点集上计算学习解与真实解的ℓ2范数误差
- 可视化:热图显示PDE解u(x,t)的值分布
- 优化算法:零阶随机梯度下降(ZO-SGD)
- 训练迭代次数:1000次
- 扰动参数:μ用于梯度估计
使用实验测量的电压-权重查找表进行仿真:
- 8位精度:由于表达能力受限,无法学习到物理规律
- 10位及以上精度:能够较好地学习PDE解
- 最终ℓ2误差:5E-3
- 训练收敛性:ℓ2误差曲线显示训练过程中逐渐捕获PDE描述的物理规律
- 比特精度:实验展示的芯片训练精度介于8位和10位之间
论文比较了不同比特精度下的性能:
- 8位:性能较差,无法有效学习
- 10位:性能显著提升
- 硬件实验:介于8位和10位之间
- 制造误差的鲁棒性:零阶优化方法能够在存在制造误差的情况下有效训练
- 环境噪声适应性:训练过程中能够适应环境噪声
- 比特精度的重要性:模拟计算的有限比特精度限制了最终学习解的准确性
- Raissi等人提出的PINN框架为求解正反问题提供了深度学习方法
- 传统PINN训练依赖反向传播,计算开销大
- 随机零阶优化:Gu等人提出FLOPS方法
- 原位反向传播:Pai等人实现了光子神经网络的原位反向传播
- 张量压缩方法:TT-PINN和TONN为大规模应用提供了可能
- 首次将零阶优化应用于光学PINN训练
- 实验验证了概念可行性
- 无需复杂的校准过程
本文成功演示了基于零阶优化的光学神经PDE求解器,通过无反向传播的芯片训练实现了PINN的光学实现,为实时边缘PDE求解提供了新的解决方案。
- 规模限制:当前实验仅在1×4 MRR权重组上进行,规模较小
- 精度限制:模拟计算的有限比特精度影响最终精度
- PDE类型:仅在一维热方程上验证,需要扩展到更复杂的PDE
- 收敛速度:零阶优化相比一阶方法收敛较慢
- 规模扩展:利用张量分解PINN(TT-PINN)和张量化光学神经网络(TONN)实现千级神经元规模
- 精度提升:改进模拟计算精度
- 应用扩展:扩展到更多类型的PDE问题
- 创新性强:首次实现光学PINN的芯片级训练,开创性工作
- 技术路线清晰:零阶优化巧妙解决了光学器件不可微的问题
- 实验验证充分:从仿真到硬件实验的完整验证链条
- 实用价值高:为边缘计算PDE求解提供了新思路
- 规模有限:1×4的权重组规模过小,距离实用化还有较大差距
- 精度不足:5E-3的误差对于某些应用可能不够精确
- 复杂度分析缺失:缺少详细的计算复杂度和能耗分析
- 泛化性验证不足:仅在一个简单PDE上验证,泛化能力未知
- 学术价值:开辟了光学计算与科学计算结合的新方向
- 技术推动:为光学神经网络的实用化提供了重要参考
- 应用前景:在边缘计算、实时仿真等领域具有潜在应用价值
- 边缘计算环境:资源受限但需要实时PDE求解的场景
- 低功耗应用:对能耗敏感的移动设备或物联网设备
- 概念验证:作为光学神经计算的技术验证平台
本文引用了PINN、光学神经网络、零阶优化等领域的重要工作,特别是:
- Raissi等人的PINN开创性工作
- 光学神经网络训练的相关研究
- 张量压缩神经网络的最新进展
总体评价:这是一篇在光学计算与科学计算交叉领域的开创性工作,虽然当前规模和精度有限,但为未来的光学PDE求解器发展奠定了重要基础。技术路线合理,实验验证充分,具有重要的学术价值和应用前景。