2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang
We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.
academic

Découverte des Singularités dans les Intégrales de Feynman via l'Apprentissage Automatique

Informations Fondamentales

  • ID de l'article: 2510.10099
  • Titre: Uncovering Singularities in Feynman Integrals via Machine Learning
  • Auteurs: Yuanche Liu (USTC), Yingxuan Xu (KIT), Yang Zhang (USTC/PKU)
  • Classification: hep-ph cs.AI cs.LG hep-th
  • Date de publication: 14 octobre 2025
  • Lien de l'article: https://arxiv.org/abs/2510.10099

Résumé

Cet article propose un cadre d'apprentissage automatique basé sur la régression symbolique pour extraire l'alphabet symbolique complet des intégrales de Feynman multi-boucles. En ciblant directement la structure analytique plutôt que le processus de réduction, cette méthode possède une large applicabilité et une interprétabilité dans différentes familles d'intégrales. Elle reconstruit avec succès l'alphabet symbolique complet dans des exemples non triviaux, démontrant robustesse et généralité. Au-delà de l'accélération des calculs individuels, ce cadre révèle universellement la structure analytique, ouvrant de nouvelles voies pour l'analyse des amplitudes multi-boucles et fournissant un outil universel pour explorer les amplitudes de diffusion.

Contexte et Motivation de la Recherche

Problèmes Fondamentaux

  1. Besoin de précision accrue dans les amplitudes de diffusion: Les futures expériences de physique des hautes énergies (HL-LHC, CEPC, FCC-ee) et les détecteurs d'ondes gravitationnelles de troisième génération exigent une précision théorique sans précédent, en particulier pour le calcul exact des amplitudes de diffusion multi-boucles.
  2. Difficulté d'extraction de l'alphabet symbolique: L'alphabet symbolique est au cœur des techniques modernes d'amplitudes, codant la structure algébrique des intégrales itérées, mais sa construction analytique est extrêmement difficile sur le plan informatique.
  3. Limitations des méthodes existantes:
    • HyperInt ne peut fournir qu'un sur-ensemble des points singuliers de Landau
    • PLD.jl et SOFIA calculent les singularités mais ne sont pas suffisamment complets
    • Baikovletter reconstruit via la représentation de Baikov mais avec des limitations

Signification de la Recherche

L'alphabet symbolique ne code pas seulement la structure algébrique des intégrales itérées, mais soutient également les techniques modernes d'amplitudes, y compris les méthodes de bootstrap pour les intégrales principales et les amplitudes de diffusion complètes. L'extraction précise de l'alphabet symbolique est cruciale pour comprendre la structure analytique des intégrales de Feynman multi-boucles.

Contributions Principales

  1. Cadre méthodologique innovant: Proposition d'une méthode d'apprentissage automatique basée sur la régression symbolique, ciblant directement la structure analytique plutôt que le processus de réduction IBP
  2. Large applicabilité: La méthode s'applique à différentes familles d'intégrales sans nécessiter de connaissance préalable des singularités ou d'étapes de réduction coûteuses
  3. Reconstruction d'alphabet complet: Identification réussie de tous les symboles d'alphabet, y compris les structures de racines carrées
  4. Validation pratique: Vérification de l'efficacité de la méthode dans plusieurs exemples multi-boucles non triviaux, y compris les intégrales à trois boucles quatre points et deux boucles trois points

Détails de la Méthode

Définition de la Tâche

Étant donné une famille d'intégrales de Feynman multi-boucles, reconstruire les expressions analytiques via la régression symbolique en utilisant les matrices d'équations différentielles canoniques (CDE) calculées numériquement, puis extraire l'alphabet symbolique complet.

Cadre Principal: Architecture à Trois Couches

1. Couche de Prétraitement (Pre-processing Layer)

  • Effectuer la réduction IBP sur la famille d'intégrales donnée, construire les matrices CDE en plusieurs points numériques
  • Utiliser l'outil Kira pour la réduction IBP numérique
  • Tronquer les coefficients rationnels à 30 chiffres significatifs, équilibrant efficacité et précision

2. Couche de Régression (Regression Layer)

  • Utiliser PySR pour la régression symbolique, reconstruire la forme analytique de la matrice CDE
  • Exploiter des algorithmes évolutionnaires pour rechercher des expressions candidates
  • Améliorer la fiabilité via des cycles « évolution-simplification-optimisation »

3. Couche de Post-traitement (Post-processing Layer)

  • Effectuer l'exponentiation et la factorisation des expressions symboliques
  • Collecter tous les symboles d'alphabet candidats, assembler l'alphabet symbolique complet

Noyau Technique: Régression Symbolique

Caractéristiques du Cadre PySR

  • Haute performance: Basé sur le backend Julia, supportant la compilation JIT et le parallélisme multi-cœurs
  • Optimisation hybride: Combinaison de la recherche de structure discrète et de l'optimisation de paramètres continus
  • Frontière de Pareto: Équilibre entre précision et complexité, fournissant plusieurs solutions candidates

Fondements Mathématiques

Le problème de régression symbolique est formalisé comme:

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

où L_D est la perte de données et C(s,θ) est le terme de pénalité de complexité.

Points d'Innovation Clés

  1. Objectif de structure directe: Indépendant de la représentation intégrale explicite ou de l'analyse des singularités
  2. Surapprentissage forcé: Obtenir des résultats précis via des expressions symboliques entièrement exactes
  3. Conception contrainte: Limiter les fonctions aux structures log et sqrt en fonction des caractéristiques CDE
  4. Extension multivariée: Support de la régression symbolique pour les équations différentielles partielles multivariées

Configuration Expérimentale

Cas de Test

  1. Intégrales à trois boucles quatre points de masse unique: 83 intégrales principales, basées sur la base UT de la littérature 40
  2. Intégrales non planaires à deux boucles trois points: Incluant les intégrales elliptiques et les polylogarithmes, avec des symboles de racines carrées

Détails d'Implémentation

  • Nombre de points numériques: 200 points cinématiques différents
  • Paramètres de précision: 30 chiffres significatifs
  • Environnement de calcul: CPU Intel i9-13950HX, parallélisme 12 cœurs
  • Critères de convergence: Erreur réduite de 10^{-2} à 10^{-30}

Critères d'Évaluation

  • Complétude: Reconstruction de l'alphabet symbolique complet
  • Exactitude: Cohérence avec les résultats connus
  • Efficacité: Temps de calcul et consommation de ressources

Résultats Expérimentaux

Réalisations Principales

Cas 1: Intégrales à Trois Boucles Quatre Points de Masse Unique

  • Expression cible:
f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)
  • Résultat de reconstruction:
f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)
  • Alphabet symbolique: {x, 1-x, y, 1-y, x+y, 1-x-y}
  • Vérification: Entièrement cohérent avec la littérature 40

Cas 2: Intégrales Non Planaires à Deux Boucles Trois Points

Identification réussie de 5 symboles d'alphabet:

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

Entièrement conforme aux résultats de la littérature 41.

Résultats des Tests Systématiques

Boucles\Famille d'intégrales1 échelle2 échelles3 échelles5 échelles5+ échelles
1 boucle
2 boucles
3 boucles——
4 boucles————————

Légende: ✓ reconstruction complète; ⚬ plupart des symboles obtenus; ✗ certains symboles non trouvés

Performance

  • Temps de calcul: Environ 1 heure par élément de matrice CDE
  • Précision atteinte: Erreur finale ~10^{-30}, cohérente avec la précision d'entrée
  • Taux de réussite: Dans les familles d'intégrales testées, la plupart des cas permettent une reconstruction complète de l'alphabet symbolique

Travaux Connexes

Méthodes Traditionnelles

  1. HyperInt: Basé sur des algorithmes de réduction, mais ne peut fournir qu'un sur-ensemble des points singuliers de Landau
  2. PLD.jl/SOFIA: Calcul des singularités, mais avec des limitations lors du traitement de structures complexes
  3. Baikovletter: Reconstruction via la représentation de Baikov, applicabilité limitée

Applications du Machine Learning en Physique

  • Les applications antérieures du ML se concentraient principalement sur l'accélération de la réduction IBP 15-17
  • Ce travail cible pour la première fois directement la structure analytique, ouvrant une nouvelle direction d'application

Développement de la Régression Symbolique

  • De la programmation génétique simple à l'optimisation multi-objectifs moderne
  • PySR représente l'outil de régression symbolique le plus avancé actuellement

Conclusions et Discussion

Conclusions Principales

  1. Validité de la méthode: Reconstruction réussie de l'alphabet symbolique complet dans plusieurs exemples non triviaux
  2. Large applicabilité: Applicable à des familles d'intégrales avec différents nombres de boucles et de jambes externes
  3. Percée technologique: Première réalisation de l'extraction directe de structures symboliques à partir de CDE numériques

Limitations

  1. Limitation aux hautes échelles: Pour les intégrales avec plus de 5 échelles, certains symboles complexes nécessitent toujours une construction manuelle
  2. Complexité informatique: Le temps de calcul augmente significativement avec la complexité de l'intégrale
  3. Dépendance à la précision: L'efficacité de la méthode dépend de la précision des données numériques d'entrée

Directions Futures

  1. Extension à des boucles plus élevées: Exploration d'applications dans des intégrales plus complexes
  2. Intégration bootstrap: Combinaison avec les méthodes de bootstrap pour accélérer la découverte de structures analytiques
  3. Augmentation de l'automatisation: Amélioration du niveau d'automatisation, réduction de l'intervention humaine

Évaluation Approfondie

Avantages

Innovation Technique

  1. Changement de paradigme: Transition des méthodes traditionnelles de réduction vers l'analyse directe de structure
  2. Fusion d'outils: Combinaison ingénieuse de la régression symbolique et des contraintes physiques
  3. Cadre universel: Fourniture d'un cadre méthodologique extensible

Suffisance Expérimentale

  1. Tests diversifiés: Couverture de différents types de familles d'intégrales
  2. Vérification de précision: Atteinte d'une haute précision cohérente avec les données d'entrée
  3. Évaluation systématique: Analyse détaillée de l'applicabilité

Valeur Pratique

  1. Accélération informatique: Réduction significative du travail d'extraction de l'alphabet symbolique
  2. Applicabilité universelle: Pas de connaissance préalable requise, large applicabilité
  3. Interprétabilité: Les résultats ont une signification physique claire

Insuffisances

Limitations de la Méthode

  1. Dépendance à l'échelle: Dégradation des performances dans les cas à hautes échelles
  2. Restrictions structurelles: Traitement actuel principalement des symboles algébriques, extension aux fonctions transcendantes à explorer
  3. Coût informatique: Les cas complexes nécessitent toujours des ressources informatiques importantes

Analyse Théorique

  1. Garanties de convergence: Absence d'analyse théorique de convergence
  2. Propagation d'erreur: Analyse insuffisante de l'impact systématique des erreurs numériques sur les résultats finaux
  3. Complétude: Impossibilité de garantir la découverte de l'alphabet complet dans tous les cas

Évaluation de l'Impact

Contributions Académiques

  1. Fusion interdisciplinaire: Démonstration du potentiel profond de l'IA dans la physique théorique
  2. Innovation méthodologique: Fourniture d'une nouvelle voie technique pour les calculs multi-boucles
  3. Développement d'outils: Fourniture d'outils informatiques pratiques à la communauté

Applications Pratiques

  1. Physique des hautes énergies: Service direct aux prédictions théoriques des expériences comme le LHC
  2. Physique des ondes gravitationnelles: Support de la modélisation précise des signaux d'ondes gravitationnelles
  3. Physique informatique: Promotion de l'intégration des méthodes de calcul symbolique et numérique

Scénarios d'Application

  1. Analyse d'intégrales multi-boucles: Particulièrement adapté aux familles d'intégrales complexes à 2-3 boucles
  2. Exploration de structures symboliques: Analyse préliminaire de structures de familles d'intégrales inconnues
  3. Outil de vérification: Vérification indépendante et vérification croisée des résultats connus

Détails Techniques Supplémentaires

Optimisation de la Configuration PySR

# Cas univarié
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# Cas multivarié
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

Contrôle de la Précision Numérique

  • Troncature des coefficients de réduction IBP à 30 chiffres
  • Erreur finale contrôlée au niveau 10^{-30}
  • Équilibre entre efficacité informatique et exigences de précision

Références

L'article cite 42 références importantes, couvrant le calcul symbolique, les équations différentielles, l'apprentissage automatique et d'autres domaines, reflétant la nature interdisciplinaire du travail et la solidité des fondations théoriques.


Évaluation Globale: Ceci est un travail de recherche interdisciplinaire d'importance innovante significative, appliquant avec succès les techniques modernes d'apprentissage automatique aux problèmes informatiques fondamentaux de la physique théorique. La méthode est novatrice, l'expérimentation complète, les résultats convaincants, ouvrant une nouvelle voie technique pour le calcul des intégrales de Feynman multi-boucles, avec une valeur académique et une signification pratique importantes.