2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang
We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.
academic

Descubrimiento de Singularidades en Integrales de Feynman mediante Aprendizaje Automático

Información Básica

  • ID del Artículo: 2510.10099
  • Título: Uncovering Singularities in Feynman Integrals via Machine Learning
  • Autores: Yuanche Liu (Universidad de Ciencia y Tecnología de China), Yingxuan Xu (KIT), Yang Zhang (Universidad de Ciencia y Tecnología de China/Universidad de Pekín)
  • Clasificación: hep-ph cs.AI cs.LG hep-th
  • Fecha de Publicación: 14 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.10099

Resumen

Este artículo propone un marco de aprendizaje automático basado en regresión simbólica para extraer el alfabeto simbólico completo de integrales de Feynman multilazo. Al dirigirse directamente a la estructura analítica en lugar del proceso de reducción, el método tiene amplia aplicabilidad e interpretabilidad en diferentes familias de integrales. Reconstruye exitosamente el alfabeto simbólico completo en ejemplos no triviales, demostrando robustez y generalidad. Más allá de acelerar cálculos individuales, el marco revela universalmente la estructura analítica, abriendo nuevas vías para el análisis de amplitudes multilazo y proporcionando herramientas universales para explorar amplitudes de dispersión.

Contexto de Investigación y Motivación

Problemas Centrales

  1. Demanda de Amplitudes de Dispersión de Alta Precisión: Los experimentos de física de altas energías futuros (HL-LHC, CEPC, FCC-ee) y detectores de ondas gravitacionales de tercera generación requieren una precisión teórica sin precedentes, particularmente en el cálculo exacto de amplitudes de dispersión multilazo.
  2. Dificultad en la Extracción del Alfabeto Simbólico: El alfabeto simbólico es el núcleo de las técnicas modernas de amplitudes, codificando la estructura algebraica de integrales iteradas, pero su construcción analítica es extremadamente desafiante computacionalmente.
  3. Limitaciones de Métodos Existentes:
    • HyperInt solo proporciona un superconjunto de puntos singulares de Landau
    • PLD.jl y SOFIA calculan singularidades pero no son suficientemente completos
    • Baikovletter reconstruye mediante representación de Baikov pero tiene limitaciones

Significado de la Investigación

El alfabeto simbólico no solo codifica la estructura algebraica de integrales iteradas, sino que también respalda técnicas modernas de amplitudes, incluyendo métodos de bootstrap para integrales maestras y amplitudes de dispersión completas. La extracción precisa del alfabeto simbólico es crucial para comprender la estructura analítica de integrales de Feynman multilazo.

Contribuciones Principales

  1. Marco Metodológico Innovador: Propone un método de aprendizaje automático basado en regresión simbólica, dirigido directamente a la estructura analítica en lugar del proceso de reducción IBP
  2. Amplia Aplicabilidad: El método es aplicable a diferentes familias de integrales, sin requerir conocimiento previo de singularidades ni pasos de reducción costosos
  3. Reconstrucción Completa del Alfabeto: Identifica exitosamente todos los símbolos del alfabeto, incluyendo estructuras de raíces cuadradas
  4. Verificación Práctica: Valida la efectividad del método en múltiples ejemplos multilazo no triviales, incluyendo integrales de tres lazos cuatro puntos e integrales de dos lazos tres puntos

Explicación Detallada del Método

Definición de la Tarea

Dada una familia de integrales de Feynman multilazo, mediante matrices de ecuaciones diferenciales canónicas (CDE) calculadas numéricamente, utilizar regresión simbólica para reconstruir expresiones analíticas y extraer el alfabeto simbólico completo.

Marco Central: Arquitectura de Tres Capas

1. Capa de Preprocesamiento (Pre-processing Layer)

  • Realiza reducción IBP en la familia de integrales dada, construyendo matrices CDE en múltiples puntos numéricos
  • Utiliza la herramienta Kira para reducción IBP numérica
  • Trunca coeficientes racionales a 30 dígitos significativos, equilibrando eficiencia y precisión

2. Capa de Regresión (Regression Layer)

  • Utiliza PySR para regresión simbólica, reconstruyendo la forma analítica de la matriz CDE
  • Emplea algoritmos evolutivos para buscar expresiones candidatas
  • Mejora la confiabilidad mediante ciclos de "evolución-simplificación-optimización"

3. Capa de Postprocesamiento (Post-processing Layer)

  • Realiza exponenciación y factorización de expresiones simbólicas
  • Recopila todos los símbolos candidatos, ensamblando el alfabeto simbólico completo

Núcleo Técnico: Regresión Simbólica

Características del Marco PySR

  • Alto Rendimiento: Basado en backend Julia, soporta compilación JIT y paralelismo multinúcleo
  • Optimización Híbrida: Combina búsqueda de estructura discreta con optimización de parámetros continuos
  • Frontera de Pareto: Equilibra precisión y complejidad, proporcionando múltiples soluciones candidatas

Fundamento Matemático

El problema de regresión simbólica se formaliza como:

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

donde L_D es la pérdida de datos y C(s,θ) es el término de penalización de complejidad.

Puntos Clave de Innovación

  1. Objetivo de Estructura Directa: No depende de representación integral explícita o análisis de singularidades
  2. Sobreajuste Forzado: Obtiene resultados precisos mediante expresiones simbólicas completamente exactas
  3. Diseño de Restricciones: Adaptado a características de CDE, limitando funciones a estructuras de log y sqrt
  4. Extensión Multivariable: Soporta regresión simbólica de ecuaciones diferenciales parciales multivariables

Configuración Experimental

Casos de Prueba

  1. Integral de Masa Única de Tres Lazos Cuatro Puntos: 83 integrales maestras, basadas en base UT de la literatura 40
  2. Integral No Planar de Dos Lazos Tres Puntos: Incluye integrales elípticas y polilogaritmos, con símbolos de raíz cuadrada

Detalles de Implementación

  • Número de Puntos Numéricos: 200 puntos cinemáticos diferentes
  • Configuración de Precisión: 30 dígitos significativos
  • Entorno Computacional: CPU Intel i9-13950HX, paralelismo de 12 núcleos
  • Criterio de Convergencia: Error reducido de 10^{-2} a 10^{-30}

Criterios de Evaluación

  • Completitud: ¿Se reconstruye el alfabeto simbólico completo?
  • Precisión: Consistencia con resultados conocidos
  • Eficiencia: Tiempo de cálculo y consumo de recursos

Resultados Experimentales

Logros Principales

Caso 1: Integral de Masa Única de Tres Lazos Cuatro Puntos

  • Expresión Objetivo:
f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)
  • Resultado Reconstruido:
f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)
  • Alfabeto Simbólico: {x, 1-x, y, 1-y, x+y, 1-x-y}
  • Verificación: Completamente consistente con la literatura 40

Caso 2: Integral No Planar de Dos Lazos Tres Puntos

Identifica exitosamente 5 símbolos del alfabeto:

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

Completamente consistente con resultados de la literatura 41.

Resultados de Pruebas Sistemáticas

Lazos\Familia de Integrales1 Escala2 Escalas3 Escalas5 Escalas5+ Escalas
1 Lazo
2 Lazos
3 Lazos——
4 Lazos————————

Leyenda: ✓ Reconstrucción completa; ⚬ Mayoría de símbolos obtenidos; ✗ Algunos símbolos no encontrados

Desempeño

  • Tiempo de Cálculo: Aproximadamente 1 hora por elemento de matriz CDE
  • Precisión Alcanzada: Error final ~10^{-30}, consistente con precisión de entrada
  • Tasa de Éxito: En las familias de integrales probadas, se logra reconstrucción completa del alfabeto simbólico en la mayoría de casos

Trabajo Relacionado

Métodos Tradicionales

  1. HyperInt: Basado en algoritmos de reducción, pero solo proporciona un superconjunto de puntos singulares de Landau
  2. PLD.jl/SOFIA: Calcula singularidades, pero tiene limitaciones al tratar estructuras complejas
  3. Baikovletter: Reconstruye mediante representación de Baikov, con alcance de aplicabilidad limitado

Aplicaciones de Aprendizaje Automático en Física

  • Las aplicaciones previas de ML se concentraban principalmente en acelerar reducción IBP 15-17
  • Este trabajo es el primero en dirigirse directamente a la estructura analítica, abriendo una nueva dirección de aplicación

Desarrollo de Regresión Simbólica

  • Desde programación genética simple hasta optimización multiobjeto moderna
  • PySR representa la herramienta de regresión simbólica más avanzada actualmente

Conclusiones y Discusión

Conclusiones Principales

  1. Validez del Método: Reconstruye exitosamente el alfabeto simbólico completo en múltiples ejemplos no triviales
  2. Amplia Aplicabilidad: Aplicable a familias de integrales con diferentes números de lazos y patas externas
  3. Avance Técnico: Primera implementación exitosa de extracción de estructura simbólica directamente desde CDE numéricos

Limitaciones

  1. Restricción de Escalas Altas: Para integrales con más de 5 escalas, algunos símbolos complejos aún requieren construcción manual
  2. Complejidad Computacional: El tiempo de cálculo aumenta significativamente con la complejidad de la integral
  3. Dependencia de Precisión: La efectividad del método depende de la precisión de los datos numéricos de entrada

Direcciones Futuras

  1. Extensión a Lazos Superiores: Explorar aplicaciones en integrales más complejas
  2. Integración Bootstrap: Combinar con métodos bootstrap para acelerar el descubrimiento de estructura analítica
  3. Mayor Automatización: Aumentar el nivel de automatización, reduciendo intervención manual

Evaluación Profunda

Ventajas

Innovación Técnica

  1. Cambio de Paradigma: Transición de métodos tradicionales de reducción al análisis directo de estructura
  2. Fusión de Herramientas: Combinación ingeniosa de regresión simbólica con restricciones físicas
  3. Marco Generalizable: Proporciona un marco metodológico extensible

Suficiencia Experimental

  1. Pruebas Diversificadas: Cubre diferentes tipos de familias de integrales
  2. Verificación de Precisión: Alcanza alta precisión consistente con datos de entrada
  3. Evaluación Sistemática: Proporciona análisis detallado de aplicabilidad

Valor Práctico

  1. Aceleración Computacional: Reduce significativamente el trabajo en extracción de alfabeto simbólico
  2. Aplicabilidad Universal: Sin requerir conocimiento previo, ampliamente aplicable
  3. Interpretabilidad: Los resultados tienen significado físico claro

Insuficiencias

Limitaciones del Método

  1. Dependencia de Escalas: El desempeño disminuye en casos de escalas altas
  2. Restricción de Estructura: Actualmente maneja principalmente símbolos algebraicos, extensión a funciones trascendentes pendiente
  3. Costo Computacional: Casos complejos aún requieren recursos computacionales sustanciales

Análisis Teórico

  1. Garantías de Convergencia: Falta análisis teórico de convergencia
  2. Análisis de Propagación de Errores: Análisis sistemático insuficiente del impacto de errores numéricos en resultados finales
  3. Completitud: No puede garantizar encontrar el alfabeto completo en todos los casos

Evaluación de Impacto

Contribución Académica

  1. Fusión Interdisciplinaria: Demuestra el potencial profundo de aplicación de IA en física teórica
  2. Innovación Metodológica: Proporciona nuevas vías técnicas para cálculos multilazo
  3. Desarrollo de Herramientas: Proporciona herramientas computacionales prácticas para la comunidad

Aplicación Práctica

  1. Física de Altas Energías: Sirve directamente a predicciones teóricas de experimentos como el LHC
  2. Física de Ondas Gravitacionales: Respalda modelado preciso de señales de ondas gravitacionales
  3. Física Computacional: Impulsa la combinación de cálculo simbólico y métodos numéricos

Escenarios de Aplicación

  1. Análisis de Integrales Multilazo: Particularmente adecuado para familias de integrales complejas de 2-3 lazos
  2. Exploración de Estructura Simbólica: Análisis de estructura inicial de familias de integrales desconocidas
  3. Herramienta de Verificación: Verificación independiente y comprobación cruzada de resultados conocidos

Complementos de Detalles Técnicos

Optimización de Configuración PySR

# Caso univariable
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# Caso multivariable
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

Control de Precisión Numérica

  • Truncamiento de coeficientes de reducción IBP a 30 dígitos
  • Error final controlado a nivel 10^{-30}
  • Equilibrio entre eficiencia computacional y requisitos de precisión

Referencias

El artículo cita 42 referencias importantes, abarcando múltiples campos incluyendo cálculo simbólico, ecuaciones diferenciales y aprendizaje automático, reflejando la naturaleza interdisciplinaria del trabajo y la solidez de su base teórica.


Evaluación General: Este es un trabajo de investigación interdisciplinaria con importante significado innovador, que aplica exitosamente técnicas modernas de aprendizaje automático a problemas computacionales centrales de la física teórica. El método es novedoso, los experimentos son suficientes, los resultados son convincentes, abriendo nuevas vías técnicas para el cálculo de integrales de Feynman multilazo, con importante valor académico y significado práctico.