Reinforcement learning-based statistical search strategy for an axion model from flavor
Nishimura, Miyao, Otsuka
We propose a reinforcement learning-based search strategy to explore new physics beyond the Standard Model. The reinforcement learning, which is one of machine learning methods, is a powerful approach to find model parameters with phenomenological constraints. As a concrete example, we focus on a minimal axion model with a global $U(1)$ flavor symmetry. Agents of the learning succeed in finding $U(1)$ charge assignments of quarks and leptons solving the flavor and cosmological puzzles in the Standard Model, and find more than 150 realistic solutions for the quark sector taking renormalization effects into account. For the solutions found by the reinforcement learning-based analysis, we discuss the sensitivity of future experiments for the detection of an axion which is a Nambu-Goldstone boson of the spontaneously broken $U(1)$. We also examine how fast the reinforcement learning-based searching method finds the best discrete parameters in comparison with conventional optimization methods. In conclusion, the efficient parameter search based on the reinforcement learning-based strategy enables us to perform a statistical analysis of the vast parameter space associated with the axion model from flavor.
academic
استراتيجية البحث الإحصائية القائمة على التعلم المعزز لنموذج أكسيون من النكهة
تقترح هذه الورقة استراتيجية بحث قائمة على التعلم المعزز لاستكشاف فيزياء جديدة تتجاوز النموذج المعياري. يعتبر التعلم المعزز، كإحدى طرق التعلم الآلي، أداة قوية للبحث عن معاملات النموذج التي تحقق القيود الظاهراتية. كمثال محدد، يركز المؤلفون على نموذج أكسيون أدنى مع تناظر نكهة U(1) عام. نجح الوكيل المتعلم في إيجاد توزيعات شحنة كوارك وليبتون U(1) التي تحل مشاكل النكهة والكونية في النموذج المعياري، واكتشف أكثر من 150 حلاً واقعياً لقطاع الكوارك عند الأخذ في الاعتبار تأثيرات إعادة التطبيع. بالنسبة للحلول التي وجدتها تحليلات التعلم المعزز، يناقش المؤلفون حساسية التجارب المستقبلية للكشف عن الأكسيون، وهو بوزون ناموبو-غولدستون الناشئ عن الكسر التلقائي لـ U(1). يختبر المؤلفون أيضاً سرعة طريقة البحث بالتعلم المعزز مقابل طرق التحسين التقليدية في إيجاد أفضل المعاملات المنفصلة.
المشاكل غير المحلولة في النموذج المعياري: يواجه النموذج المعياري مشاكل غير محلولة تشمل مشكلة التسلسل الهرمي للنكهة (التسلسل الهرمي للكتلة والزوايا المختلطة للكوارك والليبتونات)، ومشكلة CP القوية، وأصل المادة المظلمة وآليات التضخم
تحديات البحث في فضاء المعاملات: تتضمن النظريات التي تتجاوز النموذج المعياري عادة فضاء معاملات ضخماً، حيث تكون طرق التحسين التقليدية غير فعالة في البحث عن المعاملات المنفصلة
تعقيد نموذج الأكسيون: يجمع نموذج الأكسيون الأدنى بين آلية Froggatt-Nielsen وآلية Peccei-Quinn، مما يتطلب تحقيق قيود فيزياء النكهة والكونية في نفس الوقت
1,2 Ema وآخرون، Calibbi وآخرون: الاقتراح الأصلي لنموذج flaxion
8 Nishimura وآخرون: التطبيق السابق للتعلم المعزز في فيزياء النكهة
25 Sutton & Barto: النظرية الأساسية للتعلم المعزز
29 Huang & Zhou: الحساب الدقيق لكتل إعادة التطبيع
9 تعاون DMRadio: تجارب البحث عن الأكسيون المستقبلية
تمثل هذه الورقة تقدماً مهماً في تطبيق طرق التعلم الآلي في الفيزياء النظرية، خاصة في إظهار مزايا التعلم المعزز في معالجة مشاكل تحسين المعاملات المنفصلة تحت قيود معقدة. على الرغم من وجود بعض القيود، فإن طريقتها الرائدة والنتائج الغنية توفر مرجعاً قيماً للبحث في المجالات ذات الصلة.