Reinforcement learning-based statistical search strategy for an axion model from flavor
Nishimura, Miyao, Otsuka
We propose a reinforcement learning-based search strategy to explore new physics beyond the Standard Model. The reinforcement learning, which is one of machine learning methods, is a powerful approach to find model parameters with phenomenological constraints. As a concrete example, we focus on a minimal axion model with a global $U(1)$ flavor symmetry. Agents of the learning succeed in finding $U(1)$ charge assignments of quarks and leptons solving the flavor and cosmological puzzles in the Standard Model, and find more than 150 realistic solutions for the quark sector taking renormalization effects into account. For the solutions found by the reinforcement learning-based analysis, we discuss the sensitivity of future experiments for the detection of an axion which is a Nambu-Goldstone boson of the spontaneously broken $U(1)$. We also examine how fast the reinforcement learning-based searching method finds the best discrete parameters in comparison with conventional optimization methods. In conclusion, the efficient parameter search based on the reinforcement learning-based strategy enables us to perform a statistical analysis of the vast parameter space associated with the axion model from flavor.
academic
Strategia di ricerca statistica basata su apprendimento per rinforzo per un modello di assione dalla flavor
Classificazione: hep-ph (Fenomenologia della Fisica delle Alte Energie), cs.LG (Apprendimento Automatico), hep-th (Teoria della Fisica delle Alte Energie)
Data di Pubblicazione: arXiv:2409.10023v2 hep-ph 11 Ott 2025
Questo articolo propone una strategia di ricerca basata su apprendimento per rinforzo per esplorare la nuova fisica oltre il Modello Standard. L'apprendimento per rinforzo, come metodo di apprendimento automatico, rappresenta un approccio efficace per trovare parametri del modello che soddisfano i vincoli fenomenologici. Come esempio concreto, gli autori si concentrano sul modello minimo di assione con simmetria globale U(1) di flavor. L'agente di apprendimento ha trovato con successo le assegnazioni di carica U(1) per quark e leptoni che risolvono i problemi di flavor e cosmologici nel Modello Standard, scoprendo oltre 150 soluzioni realistiche per il settore dei quark considerando gli effetti di rinormalizzazione. Per le soluzioni trovate dall'analisi di apprendimento per rinforzo, gli autori discutono la sensibilità della rivelazione sperimentale futura dell'assione, che è il bosone di Nambu-Goldstone della rottura spontanea di U(1). Gli autori verificano inoltre la velocità del metodo di ricerca di apprendimento per rinforzo rispetto ai metodi di ottimizzazione tradizionali nel trovare i parametri discreti ottimali.
Problemi irrisolti del Modello Standard: Il Modello Standard presenta problemi irrisolti come la gerarchia di flavor (gerarchia di massa e angoli di mescolamento di quark e leptoni), il problema della CP forte, l'origine della materia oscura e il meccanismo inflazionario
Sfide nella ricerca dello spazio dei parametri: Le teorie oltre il Modello Standard tipicamente coinvolgono spazi parametrici enormi, dove i metodi di ottimizzazione tradizionali sono inefficienti nella ricerca di parametri discreti
Complessità del modello di assione: Il modello minimo di assione combina il meccanismo di Froggatt-Nielsen (FN) e il meccanismo di Peccei-Quinn (PQ), richiedendo di soddisfare simultaneamente i vincoli di fisica di flavor e cosmologici
Prima applicazione di apprendimento per rinforzo alla ricerca di parametri del modello di assione: Sviluppo di una strategia di ricerca basata su Deep Q-Network (DQN)
Scoperta di numerose soluzioni realistiche: Trovate 156 soluzioni di stato finale che soddisfano i vincoli di massa rinormalizzata e mescolamento
Miglioramento dell'efficienza: Riduzione del tempo di calcolo da almeno 55 giorni a 6 giorni rispetto ai metodi tradizionali
Analisi statistica: Analisi sistematica della distribuzione delle soluzioni a diverse scale energetiche
Previsioni fenomenologiche: Calcolo dell'accoppiamento assione-fotone, fornendo previsioni per esperimenti futuri come DMRadio-m3
Input: Vettore di assegnazione di carica U(1) Qa={q(Qi),q(ui),q(di),q(ϕ)} (i=1,2,3)
Output: Assegnazioni di carica che soddisfano i vincoli di fisica di flavor e cosmologici
Vincoli:
Riproduzione della massa rinormalizzata (Eα<1.75)
Riproduzione della matrice di mescolamento CKM (EijC<0.2)
Strategia ε-greedy: Bilancia esplorazione e sfruttamento, con ε che decade da 1 a 0.01
Analisi multi-scala energetica: Considera gli effetti di rinormalizzazione a quattro scale energetiche M=1014−17 GeV
Ottimizzazione in due fasi: Prima utilizza RL per trovare parametri discreti, poi utilizza Monte Carlo per ottimizzare gli accoppiamenti di Yukawa continui
Regolazione della soglia statistica: Adatta la soglia di errore di massa da 1.0 a 1.75 per adattarsi alla massa rinormalizzata
1,2 Ema et al., Calibbi et al.: Proposte originali del modello flaxion
8 Nishimura et al.: Applicazione precedente di RL in fisica di flavor degli autori
25 Sutton & Barto: Teoria fondamentale dell'apprendimento per rinforzo
29 Huang & Zhou: Calcoli precisi delle masse rinormalizzate
9 Collaborazione DMRadio: Esperimenti futuri di ricerca di assioni
Questo articolo rappresenta un importante progresso nell'applicazione di metodi di apprendimento automatico alla fisica teorica, in particolare nel dimostrare i vantaggi dell'apprendimento per rinforzo nel risolvere problemi di ottimizzazione di parametri discreti sotto vincoli complessi. Sebbene presenti alcune limitazioni, il suo metodo pioneristico e i risultati ricchi forniscono riferimenti preziosi per la ricerca nei campi correlati.