2025-11-10T03:04:02.700056

Experimental Demonstration of an Optical Neural PDE Solver via On-Chip PINN Training

Zhao, Xiao, Descos et al.

Partial differential equation (PDE) is an important math tool in science and engineering. This paper experimentally demonstrates an optical neural PDE solver by leveraging the back-propagation-free on-photonic-chip training of physics-informed neural networks.

academic

Experimental Demonstration of an Optical Neural PDE Solver via On-Chip PINN Training

基本信息

论文ID: 2501.00742
标题: Experimental Demonstration of an Optical Neural PDE Solver via On-Chip PINN Training
作者: Yequan Zhao, Xian Xiao, Antoine Descos, Yuan Yuan, Xinling Yu, Geza Kurczveil, Marco Fiorentino, Zheng Zhang, Raymond G. Beausoleil
分类: cs.LG cs.AR physics.optics
发表时间: 2025年1月1日
论文链接: https://arxiv.org/abs/2501.00742

摘要

偏微分方程(PDE)是科学和工程中的重要数学工具。本文通过利用物理信息神经网络(PINN)的无反向传播光子芯片训练，实验演示了一个光学神经PDE求解器。

研究背景与动机

1. 要解决的问题

偏微分方程求解在科学和工程中具有重要地位，传统的离散化求解方法(如有限差分法、有限元法)需要大量的数字计算资源和运行时间。物理信息神经网络(PINN)提供了一种无离散化的无监督方法，但当前的PINN训练通常需要在强大的GPU上运行数小时到数十小时。

2. 问题的重要性

PDE广泛应用于：

电磁建模和IC芯片热分析
医学成像
自主系统安全验证等关键领域，因此需要高效的实时求解方案。

3. 现有方法的局限性

传统数值方法：计算资源需求大，运行时间长
基于GPU的PINN训练：能耗高，不适合边缘设备部署
光学神经网络的反向传播训练：需要额外的存储器和光子硬件实现反向计算图，需要完全可微的神经网络模型

4. 研究动机

光学神经网络(ONN)提供了高吞吐量、低能耗、低延迟和高并行性的解决方案，但在光子芯片上训练PINN面临重大挑战，特别是反向传播的实现困难。

核心贡献

首次实验演示了基于无反向传播光子芯片训练的光学神经PDE求解器
提出了零阶优化方法，解决了光学神经网络不可微的问题，无需校准过程
实现了1×4微环谐振器(MRR)权重组的芯片级PINN训练
验证了概念可行性，在一维热方程求解上达到5E-3的ℓ2误差

方法详解

任务定义

本文研究在光子芯片上训练PINN求解偏微分方程的任务。具体以一维热方程为例：

PDE: ∂u/∂t = (1/π²)∂²u/∂x²
初始条件: u(x,0) = sin(πx)
边界条件: u(0,t) = 0; u(1,t) = 0
目标: 学习神经网络参数θ使得û(x,t) = f_θ(x,t)逼近真实解u(x,t)

模型架构

PINN架构

网络结构：前馈神经网络，包含两个隐藏层
权重矩阵规模：2×4, 4×4, 4×4, 4×1
损失函数：L = L_r + L_0 + L_b
- L_r：PDE残差损失
- L_0：初始条件损失
- L_b：边界条件损失

光学实现

1×4 MRR权重组：利用波分复用(WDM)技术
时分复用：通过不同时钟周期计算不同权重矩阵
权重编码：通过热调谐电压控制MRR权重值(0到1范围)

技术创新点

1. 零阶优化替代反向传播

传统反向传播方法：

∂L/∂θ = (∂L/∂f)(∂f/∂θ)
需要可微的神经网络模型
需要额外的反向计算硬件

零阶优化方法：

梯度估计：∂L/∂θ ≈ (L⁺ - L⁻)/(2μ)
仅需前向传播
将光学神经网络视为黑盒

2. 导数计算的零阶方法

空间导数：∂²û/∂x² = (û₊ + û₋ - 2û)/(2μ) 时间导数：∂û/∂t = (û₊ - û₋)/(2μ)

其中û₊, û₋分别对应输入加减扰动δ后的网络输出。

3. 无校准训练

直接优化光子器件的可调参数(电压值)
制造误差和环境噪声可在训练过程中自动缓解
无需预先校准过程

实验设置

硬件平台

芯片：AMF代工厂制造的1×4 MRR权重组芯片
激光器：可调谐激光器
探测器：光电探测器
控制：四个电压源进行热调谐

网络配置

输入维度：2 (空间坐标x和时间坐标t)
隐藏层：2层，每层4个神经元
输出维度：1 (PDE解û)
激活函数：σ (sigmoid)

评价指标

ℓ2误差：在测试点集上计算学习解与真实解的ℓ2范数误差
可视化：热图显示PDE解u(x,t)的值分布

训练设置

优化算法：零阶随机梯度下降(ZO-SGD)
训练迭代次数：1000次
扰动参数：μ用于梯度估计

实验结果

主要结果

1. 数值仿真结果

使用实验测量的电压-权重查找表进行仿真：

8位精度：由于表达能力受限，无法学习到物理规律
10位及以上精度：能够较好地学习PDE解

2. 硬件实验结果

最终ℓ2误差：5E-3
训练收敛性：ℓ2误差曲线显示训练过程中逐渐捕获PDE描述的物理规律
比特精度：实验展示的芯片训练精度介于8位和10位之间

消融实验

论文比较了不同比特精度下的性能：

8位：性能较差，无法有效学习
10位：性能显著提升
硬件实验：介于8位和10位之间

实验发现

制造误差的鲁棒性：零阶优化方法能够在存在制造误差的情况下有效训练
环境噪声适应性：训练过程中能够适应环境噪声
比特精度的重要性：模拟计算的有限比特精度限制了最终学习解的准确性

相关工作

1. 物理信息神经网络(PINN)

Raissi等人提出的PINN框架为求解正反问题提供了深度学习方法
传统PINN训练依赖反向传播，计算开销大

2. 光学神经网络训练

随机零阶优化：Gu等人提出FLOPS方法
原位反向传播：Pai等人实现了光子神经网络的原位反向传播
张量压缩方法：TT-PINN和TONN为大规模应用提供了可能

3. 本文优势

首次将零阶优化应用于光学PINN训练
实验验证了概念可行性
无需复杂的校准过程

结论与讨论

主要结论

本文成功演示了基于零阶优化的光学神经PDE求解器，通过无反向传播的芯片训练实现了PINN的光学实现，为实时边缘PDE求解提供了新的解决方案。

局限性

规模限制：当前实验仅在1×4 MRR权重组上进行，规模较小
精度限制：模拟计算的有限比特精度影响最终精度
PDE类型：仅在一维热方程上验证，需要扩展到更复杂的PDE
收敛速度：零阶优化相比一阶方法收敛较慢

未来方向

规模扩展：利用张量分解PINN(TT-PINN)和张量化光学神经网络(TONN)实现千级神经元规模
精度提升：改进模拟计算精度
应用扩展：扩展到更多类型的PDE问题

深度评价

优点

创新性强：首次实现光学PINN的芯片级训练，开创性工作
技术路线清晰：零阶优化巧妙解决了光学器件不可微的问题
实验验证充分：从仿真到硬件实验的完整验证链条
实用价值高：为边缘计算PDE求解提供了新思路

不足

规模有限：1×4的权重组规模过小，距离实用化还有较大差距
精度不足：5E-3的误差对于某些应用可能不够精确
复杂度分析缺失：缺少详细的计算复杂度和能耗分析
泛化性验证不足：仅在一个简单PDE上验证，泛化能力未知

影响力

学术价值：开辟了光学计算与科学计算结合的新方向
技术推动：为光学神经网络的实用化提供了重要参考
应用前景：在边缘计算、实时仿真等领域具有潜在应用价值

适用场景

边缘计算环境：资源受限但需要实时PDE求解的场景
低功耗应用：对能耗敏感的移动设备或物联网设备
概念验证：作为光学神经计算的技术验证平台

参考文献

本文引用了PINN、光学神经网络、零阶优化等领域的重要工作，特别是：

Raissi等人的PINN开创性工作
光学神经网络训练的相关研究
张量压缩神经网络的最新进展

总体评价：这是一篇在光学计算与科学计算交叉领域的开创性工作，虽然当前规模和精度有限，但为未来的光学PDE求解器发展奠定了重要基础。技术路线合理，实验验证充分，具有重要的学术价值和应用前景。