2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang

We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.

academic

Découverte des Singularités dans les Intégrales de Feynman via l'Apprentissage Automatique

Informations Fondamentales

ID de l'article: 2510.10099
Titre: Uncovering Singularities in Feynman Integrals via Machine Learning
Auteurs: Yuanche Liu (USTC), Yingxuan Xu (KIT), Yang Zhang (USTC/PKU)
Classification: hep-ph cs.AI cs.LG hep-th
Date de publication: 14 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.10099

Résumé

Cet article propose un cadre d'apprentissage automatique basé sur la régression symbolique pour extraire l'alphabet symbolique complet des intégrales de Feynman multi-boucles. En ciblant directement la structure analytique plutôt que le processus de réduction, cette méthode possède une large applicabilité et une interprétabilité dans différentes familles d'intégrales. Elle reconstruit avec succès l'alphabet symbolique complet dans des exemples non triviaux, démontrant robustesse et généralité. Au-delà de l'accélération des calculs individuels, ce cadre révèle universellement la structure analytique, ouvrant de nouvelles voies pour l'analyse des amplitudes multi-boucles et fournissant un outil universel pour explorer les amplitudes de diffusion.

Contexte et Motivation de la Recherche

Problèmes Fondamentaux

Besoin de précision accrue dans les amplitudes de diffusion: Les futures expériences de physique des hautes énergies (HL-LHC, CEPC, FCC-ee) et les détecteurs d'ondes gravitationnelles de troisième génération exigent une précision théorique sans précédent, en particulier pour le calcul exact des amplitudes de diffusion multi-boucles.
Difficulté d'extraction de l'alphabet symbolique: L'alphabet symbolique est au cœur des techniques modernes d'amplitudes, codant la structure algébrique des intégrales itérées, mais sa construction analytique est extrêmement difficile sur le plan informatique.
Limitations des méthodes existantes:
- HyperInt ne peut fournir qu'un sur-ensemble des points singuliers de Landau
- PLD.jl et SOFIA calculent les singularités mais ne sont pas suffisamment complets
- Baikovletter reconstruit via la représentation de Baikov mais avec des limitations

Signification de la Recherche

L'alphabet symbolique ne code pas seulement la structure algébrique des intégrales itérées, mais soutient également les techniques modernes d'amplitudes, y compris les méthodes de bootstrap pour les intégrales principales et les amplitudes de diffusion complètes. L'extraction précise de l'alphabet symbolique est cruciale pour comprendre la structure analytique des intégrales de Feynman multi-boucles.

Contributions Principales

Cadre méthodologique innovant: Proposition d'une méthode d'apprentissage automatique basée sur la régression symbolique, ciblant directement la structure analytique plutôt que le processus de réduction IBP
Large applicabilité: La méthode s'applique à différentes familles d'intégrales sans nécessiter de connaissance préalable des singularités ou d'étapes de réduction coûteuses
Reconstruction d'alphabet complet: Identification réussie de tous les symboles d'alphabet, y compris les structures de racines carrées
Validation pratique: Vérification de l'efficacité de la méthode dans plusieurs exemples multi-boucles non triviaux, y compris les intégrales à trois boucles quatre points et deux boucles trois points

Détails de la Méthode

Définition de la Tâche

Étant donné une famille d'intégrales de Feynman multi-boucles, reconstruire les expressions analytiques via la régression symbolique en utilisant les matrices d'équations différentielles canoniques (CDE) calculées numériquement, puis extraire l'alphabet symbolique complet.

Cadre Principal: Architecture à Trois Couches

1. Couche de Prétraitement (Pre-processing Layer)

Effectuer la réduction IBP sur la famille d'intégrales donnée, construire les matrices CDE en plusieurs points numériques
Utiliser l'outil Kira pour la réduction IBP numérique
Tronquer les coefficients rationnels à 30 chiffres significatifs, équilibrant efficacité et précision

2. Couche de Régression (Regression Layer)

Utiliser PySR pour la régression symbolique, reconstruire la forme analytique de la matrice CDE
Exploiter des algorithmes évolutionnaires pour rechercher des expressions candidates
Améliorer la fiabilité via des cycles « évolution-simplification-optimisation »

3. Couche de Post-traitement (Post-processing Layer)

Effectuer l'exponentiation et la factorisation des expressions symboliques
Collecter tous les symboles d'alphabet candidats, assembler l'alphabet symbolique complet

Noyau Technique: Régression Symbolique

Caractéristiques du Cadre PySR

Haute performance: Basé sur le backend Julia, supportant la compilation JIT et le parallélisme multi-cœurs
Optimisation hybride: Combinaison de la recherche de structure discrète et de l'optimisation de paramètres continus
Frontière de Pareto: Équilibre entre précision et complexité, fournissant plusieurs solutions candidates

Fondements Mathématiques

Le problème de régression symbolique est formalisé comme:

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

où L_D est la perte de données et C(s,θ) est le terme de pénalité de complexité.

Points d'Innovation Clés

Objectif de structure directe: Indépendant de la représentation intégrale explicite ou de l'analyse des singularités
Surapprentissage forcé: Obtenir des résultats précis via des expressions symboliques entièrement exactes
Conception contrainte: Limiter les fonctions aux structures log et sqrt en fonction des caractéristiques CDE
Extension multivariée: Support de la régression symbolique pour les équations différentielles partielles multivariées

Configuration Expérimentale

Cas de Test

Intégrales à trois boucles quatre points de masse unique: 83 intégrales principales, basées sur la base UT de la littérature 40
Intégrales non planaires à deux boucles trois points: Incluant les intégrales elliptiques et les polylogarithmes, avec des symboles de racines carrées

Détails d'Implémentation

Nombre de points numériques: 200 points cinématiques différents
Paramètres de précision: 30 chiffres significatifs
Environnement de calcul: CPU Intel i9-13950HX, parallélisme 12 cœurs
Critères de convergence: Erreur réduite de 10^{-2} à 10^{-30}

Critères d'Évaluation

Complétude: Reconstruction de l'alphabet symbolique complet
Exactitude: Cohérence avec les résultats connus
Efficacité: Temps de calcul et consommation de ressources

Résultats Expérimentaux

Réalisations Principales

Cas 1: Intégrales à Trois Boucles Quatre Points de Masse Unique

Expression cible:

f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)

Résultat de reconstruction:

f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)

Alphabet symbolique: {x, 1-x, y, 1-y, x+y, 1-x-y}
Vérification: Entièrement cohérent avec la littérature 40

Cas 2: Intégrales Non Planaires à Deux Boucles Trois Points

Identification réussie de 5 symboles d'alphabet:

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

Entièrement conforme aux résultats de la littérature 41.

Résultats des Tests Systématiques

Boucles\Famille d'intégrales	1 échelle	2 échelles	3 échelles	5 échelles	5+ échelles
1 boucle	✓	✓	✓	⚬	⚬
2 boucles	✓	✓	✓	⚬	✗
3 boucles	✓	✓	✓	⚬	——
4 boucles	✓	——	——	——	——

Légende: ✓ reconstruction complète; ⚬ plupart des symboles obtenus; ✗ certains symboles non trouvés

Performance

Temps de calcul: Environ 1 heure par élément de matrice CDE
Précision atteinte: Erreur finale ~10^{-30}, cohérente avec la précision d'entrée
Taux de réussite: Dans les familles d'intégrales testées, la plupart des cas permettent une reconstruction complète de l'alphabet symbolique

Travaux Connexes

Méthodes Traditionnelles

HyperInt: Basé sur des algorithmes de réduction, mais ne peut fournir qu'un sur-ensemble des points singuliers de Landau
PLD.jl/SOFIA: Calcul des singularités, mais avec des limitations lors du traitement de structures complexes
Baikovletter: Reconstruction via la représentation de Baikov, applicabilité limitée

Applications du Machine Learning en Physique

Les applications antérieures du ML se concentraient principalement sur l'accélération de la réduction IBP 15-17
Ce travail cible pour la première fois directement la structure analytique, ouvrant une nouvelle direction d'application

Développement de la Régression Symbolique

De la programmation génétique simple à l'optimisation multi-objectifs moderne
PySR représente l'outil de régression symbolique le plus avancé actuellement

Conclusions et Discussion

Conclusions Principales

Validité de la méthode: Reconstruction réussie de l'alphabet symbolique complet dans plusieurs exemples non triviaux
Large applicabilité: Applicable à des familles d'intégrales avec différents nombres de boucles et de jambes externes
Percée technologique: Première réalisation de l'extraction directe de structures symboliques à partir de CDE numériques

Limitations

Limitation aux hautes échelles: Pour les intégrales avec plus de 5 échelles, certains symboles complexes nécessitent toujours une construction manuelle
Complexité informatique: Le temps de calcul augmente significativement avec la complexité de l'intégrale
Dépendance à la précision: L'efficacité de la méthode dépend de la précision des données numériques d'entrée

Directions Futures

Extension à des boucles plus élevées: Exploration d'applications dans des intégrales plus complexes
Intégration bootstrap: Combinaison avec les méthodes de bootstrap pour accélérer la découverte de structures analytiques
Augmentation de l'automatisation: Amélioration du niveau d'automatisation, réduction de l'intervention humaine

Évaluation Approfondie

Avantages

Innovation Technique

Changement de paradigme: Transition des méthodes traditionnelles de réduction vers l'analyse directe de structure
Fusion d'outils: Combinaison ingénieuse de la régression symbolique et des contraintes physiques
Cadre universel: Fourniture d'un cadre méthodologique extensible

Suffisance Expérimentale

Tests diversifiés: Couverture de différents types de familles d'intégrales
Vérification de précision: Atteinte d'une haute précision cohérente avec les données d'entrée
Évaluation systématique: Analyse détaillée de l'applicabilité

Valeur Pratique

Accélération informatique: Réduction significative du travail d'extraction de l'alphabet symbolique
Applicabilité universelle: Pas de connaissance préalable requise, large applicabilité
Interprétabilité: Les résultats ont une signification physique claire

Insuffisances

Limitations de la Méthode

Dépendance à l'échelle: Dégradation des performances dans les cas à hautes échelles
Restrictions structurelles: Traitement actuel principalement des symboles algébriques, extension aux fonctions transcendantes à explorer
Coût informatique: Les cas complexes nécessitent toujours des ressources informatiques importantes

Analyse Théorique

Garanties de convergence: Absence d'analyse théorique de convergence
Propagation d'erreur: Analyse insuffisante de l'impact systématique des erreurs numériques sur les résultats finaux
Complétude: Impossibilité de garantir la découverte de l'alphabet complet dans tous les cas

Évaluation de l'Impact

Contributions Académiques

Fusion interdisciplinaire: Démonstration du potentiel profond de l'IA dans la physique théorique
Innovation méthodologique: Fourniture d'une nouvelle voie technique pour les calculs multi-boucles
Développement d'outils: Fourniture d'outils informatiques pratiques à la communauté

Applications Pratiques

Physique des hautes énergies: Service direct aux prédictions théoriques des expériences comme le LHC
Physique des ondes gravitationnelles: Support de la modélisation précise des signaux d'ondes gravitationnelles
Physique informatique: Promotion de l'intégration des méthodes de calcul symbolique et numérique

Scénarios d'Application

Analyse d'intégrales multi-boucles: Particulièrement adapté aux familles d'intégrales complexes à 2-3 boucles
Exploration de structures symboliques: Analyse préliminaire de structures de familles d'intégrales inconnues
Outil de vérification: Vérification indépendante et vérification croisée des résultats connus

Détails Techniques Supplémentaires

Optimisation de la Configuration PySR

# Cas univarié
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# Cas multivarié
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

Contrôle de la Précision Numérique

Troncature des coefficients de réduction IBP à 30 chiffres
Erreur finale contrôlée au niveau 10^{-30}
Équilibre entre efficacité informatique et exigences de précision

Références

L'article cite 42 références importantes, couvrant le calcul symbolique, les équations différentielles, l'apprentissage automatique et d'autres domaines, reflétant la nature interdisciplinaire du travail et la solidité des fondations théoriques.

Évaluation Globale: Ceci est un travail de recherche interdisciplinaire d'importance innovante significative, appliquant avec succès les techniques modernes d'apprentissage automatique aux problèmes informatiques fondamentaux de la physique théorique. La méthode est novatrice, l'expérimentation complète, les résultats convaincants, ouvrant une nouvelle voie technique pour le calcul des intégrales de Feynman multi-boucles, avec une valeur académique et une signification pratique importantes.