2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang

We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.

academic

Uncovering Singularities in Feynman Integrals via Machine Learning

基本信息

论文ID: 2510.10099
标题: Uncovering Singularities in Feynman Integrals via Machine Learning
作者: Yuanche Liu (中科大), Yingxuan Xu (KIT), Yang Zhang (中科大/北大)
分类: hep-ph cs.AI cs.LG hep-th
发表时间: 2025年10月14日
论文链接: https://arxiv.org/abs/2510.10099

摘要

本文提出了一个基于符号回归的机器学习框架，用于提取多环费曼积分的完整符号字母表。通过直接针对解析结构而非约化过程，该方法在不同积分族中具有广泛适用性和可解释性。它在非平凡例子中成功重构了完整的符号字母表，展现了鲁棒性和通用性。除了逐个加速计算外，该框架还能普遍地揭示解析结构，为多环振幅分析开辟了新途径，并提供了探索散射振幅的通用工具。

研究背景与动机

核心问题

高精度散射振幅需求：未来的高能物理实验(HL-LHC, CEPC, FCC-ee)和第三代引力波探测器要求前所未有的理论精度，特别是多环散射振幅的精确计算。
符号字母表提取困难：符号字母表是现代振幅技术的核心，编码了迭代积分的代数结构，但其解析构造在计算上极具挑战性。
现有方法局限性：
- HyperInt只能给出Landau奇点的超集
- PLD.jl和SOFIA计算奇点但不够全面
- Baikovletter通过Baikov表示重构但有限制

研究意义

符号字母表不仅编码迭代积分的代数结构，还支撑现代振幅技术，包括主积分和完整散射振幅的bootstrap方法。准确提取符号字母表对理解多环费曼积分的解析结构至关重要。

核心贡献

创新方法框架：提出基于符号回归的机器学习方法，直接针对解析结构而非IBP约化过程
广泛适用性：方法适用于不同积分族，无需先验奇点知识或昂贵的约化步骤
完整字母表重构：成功识别包括平方根结构在内的所有符号字母
实际验证：在多个非平凡多环例子中验证了方法的有效性，包括三环四点和二环三点积分

方法详解

任务定义

给定多环费曼积分族，通过数值计算的规范微分方程(CDE)矩阵，利用符号回归重构解析表达式，进而提取完整的符号字母表。

核心框架：三层架构

1. 预处理层(Pre-processing Layer)

对给定积分族进行IBP约化，在多个数值点构造CDE矩阵
使用Kira工具进行数值IBP约化
将有理系数截断至30位有效数字，平衡效率和精度

2. 回归层(Regression Layer)

使用PySR进行符号回归，重构CDE矩阵的解析形式
利用进化算法搜索候选表达式
通过"进化-简化-优化"循环提高可靠性

3. 后处理层(Post-processing Layer)

对符号表达式进行指数化和因式分解
收集所有候选符号字母，组装完整符号字母表

技术核心：符号回归

PySR框架特点

高性能：基于Julia后端，支持JIT编译和多核并行
混合优化：结合离散结构搜索和连续参数优化
Pareto前沿：平衡精度和复杂度，提供多个候选解

数学基础

符号回归问题形式化为：

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

其中L_D是数据损失，C(s,θ)是复杂度惩罚项。

关键创新点

直接结构目标：不依赖显式积分表示或奇点分析
强制过拟合：通过完全准确的符号表达式获得精确结果
约束设计：针对CDE特点，限制函数只包含log和sqrt结构
多变量扩展：支持多变量偏微分方程的符号回归

实验设置

测试案例

三环四点单质量积分：83个主积分，基于文献40的UT基
非平面二环三点积分：包含椭圆积分和多对数，具有平方根字母

实现细节

数值点数量：200个不同运动学点
精度设置：30位有效数字
计算环境：Intel i9-13950HX CPU，12核并行
收敛标准：误差从10^{-2}降至10^{-30}

评价标准

完整性：是否重构出完整符号字母表
准确性：与已知结果的一致性
效率：计算时间和资源消耗

实验结果

主要成果

案例1：三环四点单质量积分

目标表达式：

f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)

重构结果：

f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)

符号字母表：{x, 1-x, y, 1-y, x+y, 1-x-y}
验证：与文献40完全一致

案例2：非平面二环三点积分

成功识别5个符号字母：

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

与文献41结果完全吻合。

系统性测试结果

环数\积分族	1尺度	2尺度	3尺度	5尺度	5+尺度
1环	✓	✓	✓	⚬	⚬
2环	✓	✓	✓	⚬	✗
3环	✓	✓	✓	⚬	——
4环	✓	——	——	——	——

符号说明：✓完全重构；⚬大部分字母获得；✗部分字母未找到

性能表现

计算时间：单个CDE矩阵元素约1小时内完成
精度达到：最终误差~10^{-30}，与输入精度一致
成功率：在测试的积分族中，大多数情况下能完全重构符号字母表

结论与讨论

主要结论

方法有效性：成功在多个非平凡例子中重构完整符号字母表
广泛适用性：适用于不同环数和外腿数的积分族
技术突破：首次实现直接从数值CDE提取符号结构

局限性

高尺度限制：对于5个以上尺度的积分，部分复杂字母仍需手动构造
计算复杂度：随积分复杂度增加，计算时间显著增长
精度依赖：方法效果依赖于输入数值数据的精度

未来方向

扩展到更高环：探索在更复杂积分中的应用
Bootstrap集成：与bootstrap方法结合，加速解析结构发现
自动化程度：提高自动化水平，减少人工干预

深度评价

优点

技术创新

范式转换：从传统的约化方法转向直接结构分析
工具融合：巧妙结合符号回归与物理约束
通用框架：提供了可扩展的方法论框架

实验充分性

多样化测试：涵盖不同类型的积分族
精度验证：达到与输入数据一致的高精度
系统性评估：提供了详细的适用性分析

实用价值

计算加速：显著减少符号字母表提取的工作量
普遍适用：无需先验知识，适用性广泛
可解释性：结果具有明确的物理意义

不足

方法局限

尺度依赖：高尺度情况下效果下降
结构限制：目前主要处理代数字母，超越函数扩展有待探索
计算成本：复杂情况下仍需要大量计算资源

理论分析

收敛保证：缺乏理论上的收敛性分析
误差传播：数值误差对最终结果影响的系统分析不足
完备性：无法保证在所有情况下都能找到完整字母表

影响力评估

学术贡献

跨学科融合：展示了AI在理论物理中的深度应用潜力
方法论创新：为多环计算提供了新的技术路径
工具开发：为社区提供了实用的计算工具

实际应用

高能物理：直接服务于LHC等实验的理论预言
引力波物理：支持引力波信号的精确建模
计算物理：推动符号计算与数值方法的结合

适用场景

多环积分分析：特别适合2-3环的复杂积分族
符号结构探索：未知积分族的初步结构分析
验证工具：已知结果的独立验证和交叉检查

技术细节补充

PySR配置优化

# 单变量情况
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# 多变量情况
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

数值精度控制

IBP约化系数截断至30位
最终误差控制在10^{-30}量级
平衡计算效率与精度要求

参考文献

论文引用了42篇重要文献，涵盖了符号计算、微分方程、机器学习等多个领域，体现了工作的跨学科性质和理论基础的扎实性。

总体评价：这是一篇具有重要创新意义的跨学科研究工作，成功地将现代机器学习技术应用于理论物理的核心计算问题。方法新颖、实验充分、结果令人信服，为多环费曼积分的计算开辟了新的技术路径，具有重要的学术价值和实用意义。