2025-11-20T12:31:14.883101

Uncovering Singularities in Feynman Integrals via Machine Learning

Liu, Xu, Zhang

We introduce a machine-learning framework based on symbolic regression to extract the full symbol alphabet of multi-loop Feynman integrals. By targeting the analytic structure rather than reduction, the method is broadly applicable and interpretable across different families of integrals. It successfully reconstructs complete symbol alphabets in nontrivial examples, demonstrating both robustness and generality. Beyond accelerating computations case by case, it uncovers the analytic structure universally. This framework opens new avenues for multi-loop amplitude analysis and provides a versatile tool for exploring scattering amplitudes.

academic

Aufdeckung von Singularitäten in Feynman-Integralen mittels maschinellem Lernen

Grundinformationen

Paper-ID: 2510.10099
Titel: Uncovering Singularities in Feynman Integrals via Machine Learning
Autoren: Yuanche Liu (中科大), Yingxuan Xu (KIT), Yang Zhang (中科大/北大)
Klassifizierung: hep-ph cs.AI cs.LG hep-th
Veröffentlichungsdatum: 14. Oktober 2025
Paper-Link: https://arxiv.org/abs/2510.10099

Zusammenfassung

In dieser Arbeit wird ein auf symbolischer Regression basierendes Framework für maschinelles Lernen vorgestellt, das zur Extraktion vollständiger symbolischer Alphabete aus mehrschleifigen Feynman-Integralen dient. Durch direkte Ausrichtung auf die analytische Struktur anstelle des Reduktionsprozesses weist die Methode breite Anwendbarkeit und Interpretierbarkeit über verschiedene Integralfamilien hinweg auf. Sie rekonstruiert erfolgreich vollständige symbolische Alphabete in nichttrivialen Beispielen und demonstriert Robustheit und Allgemeingültigkeit. Über die Beschleunigung einzelner Berechnungen hinaus kann das Framework die analytische Struktur allgemein aufdecken, eröffnet neue Wege für die Analyse mehrschleifiger Amplituden und bietet universelle Werkzeuge zur Erforschung von Streuamplituden.

Forschungshintergrund und Motivation

Kernprobleme

Anforderung an hochpräzise Streuamplituden: Zukünftige Hochenergiephysik-Experimente (HL-LHC, CEPC, FCC-ee) und Gravitationswellendetektor der dritten Generation erfordern beispiellose theoretische Präzision, insbesondere für genaue Berechnungen mehrschleifiger Streuamplituden.
Schwierigkeit der Extraktion symbolischer Alphabete: Symbolische Alphabete sind das Herzstück moderner Amplitudentechniken und kodieren die algebraische Struktur iterierter Integrale, aber ihre analytische Konstruktion ist rechnerisch äußerst herausfordernd.
Einschränkungen bestehender Methoden:
- HyperInt kann nur eine Obermenge von Landau-Singularitäten liefern
- PLD.jl und SOFIA berechnen Singularitäten, sind aber nicht umfassend genug
- Baikovletter rekonstruiert über die Baikov-Darstellung, hat aber Einschränkungen

Forschungsbedeutung

Symbolische Alphabete kodieren nicht nur die algebraische Struktur iterierter Integrale, sondern unterstützen auch moderne Amplitudentechniken, einschließlich Bootstrap-Methoden für Hauptintegrale und vollständige Streuamplituden. Die genaue Extraktion symbolischer Alphabete ist entscheidend für das Verständnis der analytischen Struktur mehrschleifiger Feynman-Integrale.

Kernbeiträge

Innovatives Methodenframework: Vorschlag einer auf symbolischer Regression basierenden Methode des maschinellen Lernens, die direkt auf die analytische Struktur anstelle des IBP-Reduktionsprozesses abzielt
Breite Anwendbarkeit: Methode ist auf verschiedene Integralfamilien anwendbar, ohne vorherige Singularitätskenntnisse oder teure Reduktionsschritte
Vollständige Alphabetrekonstruktion: Erfolgreiche Identifikation aller symbolischen Buchstaben einschließlich Wurzelstrukturen
Praktische Validierung: Verifikation der Methodeneffektivität in mehreren nichttrivialen mehrschleifigen Beispielen, einschließlich dreischleufiger Vier-Punkt- und zweischleufiger Drei-Punkt-Integrale

Methodische Details

Aufgabendefinition

Gegeben eine mehrschleufige Feynman-Integralfamilie wird durch numerisch berechnete kanonische Differentialgleichungsmatrizen (CDE) mittels symbolischer Regression die analytische Ausdrucksform rekonstruiert, um die vollständigen symbolischen Alphabete zu extrahieren.

Kern-Framework: Drei-Schichten-Architektur

1. Vorverarbeitungsschicht (Pre-processing Layer)

IBP-Reduktion der gegebenen Integralfamilie, Konstruktion von CDE-Matrizen an mehreren numerischen Punkten
Verwendung des Kira-Werkzeugs für numerische IBP-Reduktion
Kürzung rationaler Koeffizienten auf 30 signifikante Ziffern, Ausgleich zwischen Effizienz und Präzision

2. Regressionsschicht (Regression Layer)

Verwendung von PySR für symbolische Regression zur Rekonstruktion der analytischen Form der CDE-Matrix
Nutzung von Evolutionsalgorithmen zur Suche nach Kandidatenausdrücken
Verbesserung der Zuverlässigkeit durch "Evolution-Vereinfachung-Optimierung"-Zyklus

3. Nachverarbeitungsschicht (Post-processing Layer)

Exponentiation und Faktorisierung symbolischer Ausdrücke
Sammlung aller Kandidaten-Symbole, Zusammenstellung des vollständigen symbolischen Alphabets

Technischer Kern: Symbolische Regression

PySR-Framework-Eigenschaften

Hohe Leistung: Basierend auf Julia-Backend, unterstützt JIT-Kompilierung und Multi-Core-Parallelisierung
Hybridoptimierung: Kombination diskreter Struktursuche und kontinuierlicher Parameteroptimierung
Pareto-Front: Ausgleich zwischen Genauigkeit und Komplexität, bietet mehrere Kandidatenlösungen

Mathematische Grundlagen

Das symbolische Regressionsproblem wird formalisiert als:

(s*, θ*) = argmin{min L_D(f_{s,θ}) + λC(s,θ)}

wobei L_D der Datenverlust ist und C(s,θ) der Komplexitätsbestrafungsterm.

Schlüsselinnovationen

Direkte Strukturziele: Unabhängig von expliziter Integraldarstellung oder Singularitätsanalyse
Erzwungenes Overfitting: Erreichung präziser Ergebnisse durch vollständig genaue symbolische Ausdrücke
Constraint-Design: Angepasst an CDE-Charakteristiken, Beschränkung von Funktionen auf log- und sqrt-Strukturen
Multivariate Erweiterung: Unterstützung symbolischer Regression für multivariate partielle Differentialgleichungen

Experimentelle Einrichtung

Testfälle

Dreischleufige Vier-Punkt-Einfachmasse-Integrale: 83 Hauptintegrale basierend auf UT-Basis aus Literatur 40
Nichtplanare zweischleufige Drei-Punkt-Integrale: Enthält elliptische Integrale und Polylogarithmen mit Wurzelbuchstaben

Implementierungsdetails

Anzahl numerischer Punkte: 200 verschiedene kinematische Punkte
Präzisionseinstellung: 30 signifikante Ziffern
Rechenumgebung: Intel i9-13950HX CPU, 12-Kern-Parallelisierung
Konvergenzkriterium: Fehler von 10^{-2} bis 10^{-30}

Bewertungskriterien

Vollständigkeit: Rekonstruktion des vollständigen symbolischen Alphabets
Genauigkeit: Konsistenz mit bekannten Ergebnissen
Effizienz: Rechenzeit und Ressourcenverbrauch

Experimentelle Ergebnisse

Hauptergebnisse

Fall 1: Dreischleufige Vier-Punkt-Einfachmasse-Integrale

Zielausdruck:

f(x,y) = (14/15)log(1-x) - (2/5)log((1-x-y)/(1-x)) + (2/5)log(y)

Rekonstruktionsergebnis:

f₂ = (4/3)log(1-x) - (2/5)log(1-x-y) + (2/5)log(y)

Symbolisches Alphabet: {x, 1-x, y, 1-y, x+y, 1-x-y}
Verifikation: Vollständig konsistent mit Literatur 40

Fall 2: Nichtplanare zweischleufige Drei-Punkt-Integrale

Erfolgreiche Identifikation von 5 symbolischen Buchstaben:

l₁ = √x
l₂ = (1/2)(√x + √(x+4))
l₃ = √(x+4)
l₄ = (1/2)(√x + √(x-4))
l₅ = √(x-4)

Vollständig übereinstimmend mit Ergebnissen aus Literatur 41.

Systematische Testergebnisse

Schleifen\Integralfamilie	1-Skala	2-Skala	3-Skala	5-Skala	5+-Skala
1-Schleife	✓	✓	✓	⚬	⚬
2-Schleifen	✓	✓	✓	⚬	✗
3-Schleifen	✓	✓	✓	⚬	——
4-Schleifen	✓	——	——	——	——

Symbolerklärung: ✓ vollständig rekonstruiert; ⚬ meiste Buchstaben erhalten; ✗ einige Buchstaben nicht gefunden

Leistungsverhalten

Rechenzeit: Einzelnes CDE-Matrixelement in etwa 1 Stunde abgeschlossen
Erreichte Präzision: Endfehler ~10^{-30}, konsistent mit Eingabepräzision
Erfolgsquote: In den getesteten Integralfamilien kann in den meisten Fällen das vollständige symbolische Alphabet rekonstruiert werden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Methodeneffektivität: Erfolgreiche Rekonstruktion vollständiger symbolischer Alphabete in mehreren nichttrivialen Beispielen
Breite Anwendbarkeit: Anwendbar auf Integralfamilien mit verschiedenen Schleifenzahlen und äußeren Beinen
Technischer Durchbruch: Erstmalige direkte Extraktion symbolischer Strukturen aus numerischen CDEs

Einschränkungen

Hochskala-Limitierung: Bei Integralen mit mehr als fünf Skalen müssen einige komplexe Buchstaben noch manuell konstruiert werden
Rechenkomplexität: Mit zunehmender Integralskomplexität wächst die Rechenzeit erheblich
Präzisionsabhängigkeit: Methodeneffektivität hängt von der Präzision der Eingabenumerikdaten ab

Zukünftige Richtungen

Erweiterung auf höhere Schleifen: Erforschung der Anwendung bei komplexeren Integralen
Bootstrap-Integration: Kombination mit Bootstrap-Methoden zur Beschleunigung der Entdeckung analytischer Strukturen
Automatisierungsgrad: Erhöhung des Automatisierungsgrades, Verringerung manueller Eingriffe

Tiefgreifende Bewertung

Stärken

Technische Innovation

Paradigmenwechsel: Von traditionellen Reduktionsmethoden zu direkter Strukturanalyse
Werkzeugfusion: Geschickte Kombination symbolischer Regression mit physikalischen Constraints
Universelles Framework: Bereitstellung eines erweiterbaren methodologischen Rahmens

Experimentelle Vollständigkeit

Diversifizierte Tests: Abdeckung verschiedener Integralfamilientypen
Präzisionsverifikation: Erreicht mit Eingabedaten konsistente hohe Präzision
Systematische Bewertung: Detaillierte Analyse der Anwendbarkeit

Praktischer Wert

Rechenbeschleunigung: Signifikante Reduktion des Aufwands für die Extraktion symbolischer Alphabete
Universelle Anwendbarkeit: Keine Vorkenntnisse erforderlich, breite Anwendbarkeit
Interpretierbarkeit: Ergebnisse haben klare physikalische Bedeutung

Mängel

Methodische Einschränkungen

Skala-Abhängigkeit: Leistung bei hochskaligen Fällen nimmt ab
Strukturbeschränkungen: Behandelt derzeit hauptsächlich algebraische Buchstaben, Erweiterung auf transzendente Funktionen ausstehend
Rechenkosten: Komplexe Fälle erfordern immer noch erhebliche Rechenressourcen

Theoretische Analyse

Konvergenzgarantie: Fehlende theoretische Konvergenzanalyse
Fehlerfortpflanzung: Systematische Analyse der Auswirkung numerischer Fehler auf Endergebnisse unzureichend
Vollständigkeit: Kann nicht garantieren, dass in allen Fällen das vollständige Alphabet gefunden wird

Bewertung der Auswirkungen

Akademische Beiträge

Interdisziplinäre Fusion: Demonstriert tiefes Anwendungspotenzial von KI in der theoretischen Physik
Methodologische Innovation: Bietet neue technische Wege für mehrschleufige Berechnungen
Werkzeugentwicklung: Stellt praktische Rechenwerkzeuge für die Gemeinschaft bereit

Praktische Anwendungen

Hochenergiephysik: Direkte Unterstützung theoretischer Vorhersagen für LHC-ähnliche Experimente
Gravitationswellenphysik: Unterstützt präzise Modellierung von Gravitationswellensignalen
Rechnerische Physik: Fördert die Kombination symbolischer Berechnung und numerischer Methoden

Anwendungsszenarien

Mehrschleufige Integralanalyse: Besonders geeignet für komplexe Integralfamilien mit 2-3 Schleifen
Erforschung symbolischer Strukturen: Vorläufige Strukturanalyse unbekannter Integralfamilien
Verifikationswerkzeug: Unabhängige Verifikation und Kreuzprüfung bekannter Ergebnisse

Ergänzende technische Details

PySR-Konfigurationsoptimierung

# Univariater Fall
expression_spec = TemplateExpressionSpec(
    expressions=["f"],
    variable_names=["x"],
    combine="df = D(f, 1); df(x)",
)

# Multivariater Fall
nested_constraints = {
    "sqrt": {"sqrt": 0, "log": 0},
    "log": {"sqrt": 1, "log": 0},
}

Numerische Präzisionskontrolle

IBP-Reduktionskoeffizienten gekürzt auf 30 Ziffern
Endfehler kontrolliert auf 10^{-30}-Größenordnung
Ausgleich zwischen Recheneffizienz und Präzisionsanforderungen

Literaturverzeichnis

Das Paper zitiert 42 wichtige Referenzen, die Symbolische Berechnung, Differentialgleichungen, maschinelles Lernen und andere Bereiche abdecken, was die interdisziplinäre Natur der Arbeit und die Solidität der theoretischen Grundlagen widerspiegelt.

Gesamtbewertung: Dies ist eine Arbeit von bedeutender Innovationskraft, die moderne Techniken des maschinellen Lernens erfolgreich auf Kernberechnungsprobleme der theoretischen Physik anwendet. Die Methode ist neuartig, die Experimente umfassend, die Ergebnisse überzeugend. Sie eröffnet neue technische Wege für die Berechnung mehrschleufiger Feynman-Integrale und besitzt bedeutenden akademischen Wert sowie praktische Relevanz.