Reinforcement learning-based statistical search strategy for an axion model from flavor
Nishimura, Miyao, Otsuka
We propose a reinforcement learning-based search strategy to explore new physics beyond the Standard Model. The reinforcement learning, which is one of machine learning methods, is a powerful approach to find model parameters with phenomenological constraints. As a concrete example, we focus on a minimal axion model with a global $U(1)$ flavor symmetry. Agents of the learning succeed in finding $U(1)$ charge assignments of quarks and leptons solving the flavor and cosmological puzzles in the Standard Model, and find more than 150 realistic solutions for the quark sector taking renormalization effects into account. For the solutions found by the reinforcement learning-based analysis, we discuss the sensitivity of future experiments for the detection of an axion which is a Nambu-Goldstone boson of the spontaneously broken $U(1)$. We also examine how fast the reinforcement learning-based searching method finds the best discrete parameters in comparison with conventional optimization methods. In conclusion, the efficient parameter search based on the reinforcement learning-based strategy enables us to perform a statistical analysis of the vast parameter space associated with the axion model from flavor.
academic
Verstärkungslernbasierte statistische Suchstrategie für ein Axionmodell aus Flavor
In diesem Paper wird eine auf Verstärkungslernen basierende Suchstrategie zur Erforschung neuer Physik jenseits des Standardmodells vorgestellt. Verstärkungslernen als eine Methode des maschinellen Lernens ist ein leistungsstarkes Verfahren zur Auffindung von Modellparametern, die phänomenologische Einschränkungen erfüllen. Als konkretes Beispiel konzentrieren sich die Autoren auf das minimale Axionmodell mit globaler U(1)-Flavor-Symmetrie. Der lernende Agent findet erfolgreich Quark- und Lepton-U(1)-Ladungszuweisungen, die die Flavor- und kosmologischen Probleme des Standardmodells lösen, und findet über 150 realistische Lösungen für den Quark-Sektor unter Berücksichtigung von Renormierungseffekten. Für die durch die Verstärkungslernanalyse gefundenen Lösungen diskutieren die Autoren die Empfindlichkeit zukünftiger experimenteller Axion-Nachweise, wobei das Axion das Nambu-Goldstone-Boson der spontan gebrochenen U(1) ist. Die Autoren überprüfen auch die Geschwindigkeit der Verstärkungslern-Suchmethode im Vergleich zu traditionellen Optimierungsmethoden beim Auffinden optimaler diskreter Parameter.
Ungelöste Probleme des Standardmodells: Das Standardmodell weist ungelöste Probleme wie die Flavor-Hierarchie (Massenhierarchie und Mischungswinkel von Quarks und Leptonen), das starke CP-Problem, den Ursprung der Dunklen Materie und den Inflationsmechanismus auf
Herausforderungen bei der Parameterraum-Suche: Theorien jenseits des Standardmodells beinhalten typischerweise riesige Parameterräume, wobei traditionelle Optimierungsmethoden bei der Suche nach diskreten Parametern ineffizient sind
Komplexität des Axionmodells: Das minimale Axionmodell kombiniert den Froggatt-Nielsen (FN)-Mechanismus und den Peccei-Quinn (PQ)-Mechanismus und muss gleichzeitig Flavor-Physik- und Kosmologie-Einschränkungen erfüllen
Erstmalige Anwendung von Verstärkungslernen auf die Parametersuche von Axionmodellen: Entwicklung einer auf Deep Q-Network (DQN) basierenden Suchstrategie
Entdeckung einer großen Anzahl realistischer Lösungen: Auffindung von 156 Endzustandslösungen, die Renormierungsmasse- und Mischungsbeschränkungen erfüllen
Effizienzsteigerung: Reduzierung der Rechenzeit von mindestens 55 Tagen auf 6 Tage im Vergleich zu traditionellen Methoden
Statistische Analyse: Systematische statistische Analyse der Lösungsverteilung bei verschiedenen Energieskalen
Phänomenologische Vorhersagen: Berechnung der Axion-Photon-Kopplung zur Bereitstellung von Vorhersagen für zukünftige Experimente wie DMRadio-m3
Dieses Paper stellt einen wichtigen Fortschritt in der Anwendung von maschinellem Lernen in der theoretischen Physik dar, insbesondere bei der Demonstration der Vorteile von Verstärkungslernen bei der Lösung diskreter Parameteroptimierungsprobleme unter komplexen Einschränkungen. Obwohl es einige Einschränkungen gibt, bieten die bahnbrechende Methode und die reichhaltigen Ergebnisse wertvolle Referenzen für verwandte Forschungsbereiche.