2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang

We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.

academic

Descubrimiento de Singularidades en Integrales de Feynman mediante Aprendizaje Automático

Información Básica

ID del Artículo: 2510.10099
Título: Uncovering Singularities in Feynman Integrals via Machine Learning
Autores: Yuanche Liu (Universidad de Ciencia y Tecnología de China), Yingxuan Xu (KIT), Yang Zhang (Universidad de Ciencia y Tecnología de China/Universidad de Pekín)
Clasificación: hep-ph cs.AI cs.LG hep-th
Fecha de Publicación: 14 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.10099

Resumen

Este artículo propone un marco de aprendizaje automático basado en regresión simbólica para extraer el alfabeto simbólico completo de integrales de Feynman multilazo. Al dirigirse directamente a la estructura analítica en lugar del proceso de reducción, el método tiene amplia aplicabilidad e interpretabilidad en diferentes familias de integrales. Reconstruye exitosamente el alfabeto simbólico completo en ejemplos no triviales, demostrando robustez y generalidad. Más allá de acelerar cálculos individuales, el marco revela universalmente la estructura analítica, abriendo nuevas vías para el análisis de amplitudes multilazo y proporcionando herramientas universales para explorar amplitudes de dispersión.

Contexto de Investigación y Motivación

Problemas Centrales

Demanda de Amplitudes de Dispersión de Alta Precisión: Los experimentos de física de altas energías futuros (HL-LHC, CEPC, FCC-ee) y detectores de ondas gravitacionales de tercera generación requieren una precisión teórica sin precedentes, particularmente en el cálculo exacto de amplitudes de dispersión multilazo.
Dificultad en la Extracción del Alfabeto Simbólico: El alfabeto simbólico es el núcleo de las técnicas modernas de amplitudes, codificando la estructura algebraica de integrales iteradas, pero su construcción analítica es extremadamente desafiante computacionalmente.
Limitaciones de Métodos Existentes:
- HyperInt solo proporciona un superconjunto de puntos singulares de Landau
- PLD.jl y SOFIA calculan singularidades pero no son suficientemente completos
- Baikovletter reconstruye mediante representación de Baikov pero tiene limitaciones

Significado de la Investigación

El alfabeto simbólico no solo codifica la estructura algebraica de integrales iteradas, sino que también respalda técnicas modernas de amplitudes, incluyendo métodos de bootstrap para integrales maestras y amplitudes de dispersión completas. La extracción precisa del alfabeto simbólico es crucial para comprender la estructura analítica de integrales de Feynman multilazo.

Contribuciones Principales

Marco Metodológico Innovador: Propone un método de aprendizaje automático basado en regresión simbólica, dirigido directamente a la estructura analítica en lugar del proceso de reducción IBP
Amplia Aplicabilidad: El método es aplicable a diferentes familias de integrales, sin requerir conocimiento previo de singularidades ni pasos de reducción costosos
Reconstrucción Completa del Alfabeto: Identifica exitosamente todos los símbolos del alfabeto, incluyendo estructuras de raíces cuadradas
Verificación Práctica: Valida la efectividad del método en múltiples ejemplos multilazo no triviales, incluyendo integrales de tres lazos cuatro puntos e integrales de dos lazos tres puntos

Explicación Detallada del Método

Definición de la Tarea

Dada una familia de integrales de Feynman multilazo, mediante matrices de ecuaciones diferenciales canónicas (CDE) calculadas numéricamente, utilizar regresión simbólica para reconstruir expresiones analíticas y extraer el alfabeto simbólico completo.

Marco Central: Arquitectura de Tres Capas

1. Capa de Preprocesamiento (Pre-processing Layer)

Realiza reducción IBP en la familia de integrales dada, construyendo matrices CDE en múltiples puntos numéricos
Utiliza la herramienta Kira para reducción IBP numérica
Trunca coeficientes racionales a 30 dígitos significativos, equilibrando eficiencia y precisión

2. Capa de Regresión (Regression Layer)

Utiliza PySR para regresión simbólica, reconstruyendo la forma analítica de la matriz CDE
Emplea algoritmos evolutivos para buscar expresiones candidatas
Mejora la confiabilidad mediante ciclos de "evolución-simplificación-optimización"

3. Capa de Postprocesamiento (Post-processing Layer)

Realiza exponenciación y factorización de expresiones simbólicas
Recopila todos los símbolos candidatos, ensamblando el alfabeto simbólico completo

Núcleo Técnico: Regresión Simbólica

Características del Marco PySR

Alto Rendimiento: Basado en backend Julia, soporta compilación JIT y paralelismo multinúcleo
Optimización Híbrida: Combina búsqueda de estructura discreta con optimización de parámetros continuos
Frontera de Pareto: Equilibra precisión y complejidad, proporcionando múltiples soluciones candidatas

Fundamento Matemático

El problema de regresión simbólica se formaliza como:

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

donde L_D es la pérdida de datos y C(s,θ) es el término de penalización de complejidad.

Puntos Clave de Innovación

Objetivo de Estructura Directa: No depende de representación integral explícita o análisis de singularidades
Sobreajuste Forzado: Obtiene resultados precisos mediante expresiones simbólicas completamente exactas
Diseño de Restricciones: Adaptado a características de CDE, limitando funciones a estructuras de log y sqrt
Extensión Multivariable: Soporta regresión simbólica de ecuaciones diferenciales parciales multivariables

Configuración Experimental

Casos de Prueba

Integral de Masa Única de Tres Lazos Cuatro Puntos: 83 integrales maestras, basadas en base UT de la literatura 40
Integral No Planar de Dos Lazos Tres Puntos: Incluye integrales elípticas y polilogaritmos, con símbolos de raíz cuadrada

Detalles de Implementación

Número de Puntos Numéricos: 200 puntos cinemáticos diferentes
Configuración de Precisión: 30 dígitos significativos
Entorno Computacional: CPU Intel i9-13950HX, paralelismo de 12 núcleos
Criterio de Convergencia: Error reducido de 10^{-2} a 10^{-30}

Criterios de Evaluación

Completitud: ¿Se reconstruye el alfabeto simbólico completo?
Precisión: Consistencia con resultados conocidos
Eficiencia: Tiempo de cálculo y consumo de recursos

Resultados Experimentales

Logros Principales

Caso 1: Integral de Masa Única de Tres Lazos Cuatro Puntos

Expresión Objetivo:

f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)

Resultado Reconstruido:

f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)

Alfabeto Simbólico: {x, 1-x, y, 1-y, x+y, 1-x-y}
Verificación: Completamente consistente con la literatura 40

Caso 2: Integral No Planar de Dos Lazos Tres Puntos

Identifica exitosamente 5 símbolos del alfabeto:

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

Completamente consistente con resultados de la literatura 41.

Resultados de Pruebas Sistemáticas

Lazos\Familia de Integrales	1 Escala	2 Escalas	3 Escalas	5 Escalas	5+ Escalas
1 Lazo	✓	✓	✓	⚬	⚬
2 Lazos	✓	✓	✓	⚬	✗
3 Lazos	✓	✓	✓	⚬	——
4 Lazos	✓	——	——	——	——

Leyenda: ✓ Reconstrucción completa; ⚬ Mayoría de símbolos obtenidos; ✗ Algunos símbolos no encontrados

Desempeño

Tiempo de Cálculo: Aproximadamente 1 hora por elemento de matriz CDE
Precisión Alcanzada: Error final ~10^{-30}, consistente con precisión de entrada
Tasa de Éxito: En las familias de integrales probadas, se logra reconstrucción completa del alfabeto simbólico en la mayoría de casos

Trabajo Relacionado

Métodos Tradicionales

HyperInt: Basado en algoritmos de reducción, pero solo proporciona un superconjunto de puntos singulares de Landau
PLD.jl/SOFIA: Calcula singularidades, pero tiene limitaciones al tratar estructuras complejas
Baikovletter: Reconstruye mediante representación de Baikov, con alcance de aplicabilidad limitado

Aplicaciones de Aprendizaje Automático en Física

Las aplicaciones previas de ML se concentraban principalmente en acelerar reducción IBP 15-17
Este trabajo es el primero en dirigirse directamente a la estructura analítica, abriendo una nueva dirección de aplicación

Desarrollo de Regresión Simbólica

Desde programación genética simple hasta optimización multiobjeto moderna
PySR representa la herramienta de regresión simbólica más avanzada actualmente

Conclusiones y Discusión

Conclusiones Principales

Validez del Método: Reconstruye exitosamente el alfabeto simbólico completo en múltiples ejemplos no triviales
Amplia Aplicabilidad: Aplicable a familias de integrales con diferentes números de lazos y patas externas
Avance Técnico: Primera implementación exitosa de extracción de estructura simbólica directamente desde CDE numéricos

Limitaciones

Restricción de Escalas Altas: Para integrales con más de 5 escalas, algunos símbolos complejos aún requieren construcción manual
Complejidad Computacional: El tiempo de cálculo aumenta significativamente con la complejidad de la integral
Dependencia de Precisión: La efectividad del método depende de la precisión de los datos numéricos de entrada

Direcciones Futuras

Extensión a Lazos Superiores: Explorar aplicaciones en integrales más complejas
Integración Bootstrap: Combinar con métodos bootstrap para acelerar el descubrimiento de estructura analítica
Mayor Automatización: Aumentar el nivel de automatización, reduciendo intervención manual

Evaluación Profunda

Ventajas

Innovación Técnica

Cambio de Paradigma: Transición de métodos tradicionales de reducción al análisis directo de estructura
Fusión de Herramientas: Combinación ingeniosa de regresión simbólica con restricciones físicas
Marco Generalizable: Proporciona un marco metodológico extensible

Suficiencia Experimental

Pruebas Diversificadas: Cubre diferentes tipos de familias de integrales
Verificación de Precisión: Alcanza alta precisión consistente con datos de entrada
Evaluación Sistemática: Proporciona análisis detallado de aplicabilidad

Valor Práctico

Aceleración Computacional: Reduce significativamente el trabajo en extracción de alfabeto simbólico
Aplicabilidad Universal: Sin requerir conocimiento previo, ampliamente aplicable
Interpretabilidad: Los resultados tienen significado físico claro

Insuficiencias

Limitaciones del Método

Dependencia de Escalas: El desempeño disminuye en casos de escalas altas
Restricción de Estructura: Actualmente maneja principalmente símbolos algebraicos, extensión a funciones trascendentes pendiente
Costo Computacional: Casos complejos aún requieren recursos computacionales sustanciales

Análisis Teórico

Garantías de Convergencia: Falta análisis teórico de convergencia
Análisis de Propagación de Errores: Análisis sistemático insuficiente del impacto de errores numéricos en resultados finales
Completitud: No puede garantizar encontrar el alfabeto completo en todos los casos

Evaluación de Impacto

Contribución Académica

Fusión Interdisciplinaria: Demuestra el potencial profundo de aplicación de IA en física teórica
Innovación Metodológica: Proporciona nuevas vías técnicas para cálculos multilazo
Desarrollo de Herramientas: Proporciona herramientas computacionales prácticas para la comunidad

Aplicación Práctica

Física de Altas Energías: Sirve directamente a predicciones teóricas de experimentos como el LHC
Física de Ondas Gravitacionales: Respalda modelado preciso de señales de ondas gravitacionales
Física Computacional: Impulsa la combinación de cálculo simbólico y métodos numéricos

Escenarios de Aplicación

Análisis de Integrales Multilazo: Particularmente adecuado para familias de integrales complejas de 2-3 lazos
Exploración de Estructura Simbólica: Análisis de estructura inicial de familias de integrales desconocidas
Herramienta de Verificación: Verificación independiente y comprobación cruzada de resultados conocidos

Complementos de Detalles Técnicos

Optimización de Configuración PySR

# Caso univariable
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# Caso multivariable
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

Control de Precisión Numérica

Truncamiento de coeficientes de reducción IBP a 30 dígitos
Error final controlado a nivel 10^{-30}
Equilibrio entre eficiencia computacional y requisitos de precisión

Referencias

El artículo cita 42 referencias importantes, abarcando múltiples campos incluyendo cálculo simbólico, ecuaciones diferenciales y aprendizaje automático, reflejando la naturaleza interdisciplinaria del trabajo y la solidez de su base teórica.

Evaluación General: Este es un trabajo de investigación interdisciplinaria con importante significado innovador, que aplica exitosamente técnicas modernas de aprendizaje automático a problemas computacionales centrales de la física teórica. El método es novedoso, los experimentos son suficientes, los resultados son convincentes, abriendo nuevas vías técnicas para el cálculo de integrales de Feynman multilazo, con importante valor académico y significado práctico.