Reinforcement learning-based statistical search strategy for an axion model from flavor
Nishimura, Miyao, Otsuka
We propose a reinforcement learning-based search strategy to explore new physics beyond the Standard Model. The reinforcement learning, which is one of machine learning methods, is a powerful approach to find model parameters with phenomenological constraints. As a concrete example, we focus on a minimal axion model with a global $U(1)$ flavor symmetry. Agents of the learning succeed in finding $U(1)$ charge assignments of quarks and leptons solving the flavor and cosmological puzzles in the Standard Model, and find more than 150 realistic solutions for the quark sector taking renormalization effects into account. For the solutions found by the reinforcement learning-based analysis, we discuss the sensitivity of future experiments for the detection of an axion which is a Nambu-Goldstone boson of the spontaneously broken $U(1)$. We also examine how fast the reinforcement learning-based searching method finds the best discrete parameters in comparison with conventional optimization methods. In conclusion, the efficient parameter search based on the reinforcement learning-based strategy enables us to perform a statistical analysis of the vast parameter space associated with the axion model from flavor.
본 논문은 표준모형을 넘어선 새로운 물리를 탐색하기 위한 강화학습 기반 탐색 전략을 제시한다. 기계학습 방법 중 하나인 강화학습은 현상론적 제약을 만족하는 모델 매개변수를 찾기 위한 강력한 방법이다. 구체적인 예시로, 저자들은 전역 U(1) 맛 대칭성을 가진 최소 액시온 모델에 초점을 맞춘다. 학습 에이전트는 표준모형의 맛 계층 문제와 우주론적 문제를 해결하는 쿼크 및 렙톤 U(1) 전하 배치를 성공적으로 발견했으며, 재정규화 효과를 고려할 때 쿼크 부문에서 150개 이상의 현실적 해를 찾았다. 강화학습 분석으로 발견된 해에 대해, 저자들은 U(1)의 자발적 대칭 깨짐의 Nambu-Goldstone 보손인 액시온을 탐지하기 위한 미래 실험의 민감도를 논의한다. 또한 저자들은 강화학습 탐색 방법이 기존 최적화 방법 대비 이산 매개변수의 최적값을 찾는 속도를 검증했다.
이 논문은 기계학습 방법이 이론 물리학에 응용되는 중요한 진전을 나타내며, 특히 복잡한 제약 하에서의 이산 매개변수 최적화 문제 처리에 있어 강화학습의 우월성을 보여준다. 일부 제한사항이 있지만, 개척적인 방법론과 풍부한 결과는 관련 분야의 연구에 귀중한 참고자료를 제공한다.