Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
본 연구는 고광도 대형 강입자 충돌기(HL-LHC)의 예상되는 높은 중첩 조건 하에서 ATLAS 액체 아르곤 카로리미터 셀 에너지 침적 재구성을 위한 신경망 아키텍처를 심층 연구한다. 이러한 네트워크는 엄격한 크기 및 지연 제약 조건 하에서 카로리미터 FPGA 기반 읽기 하드웨어에서 작동하도록 설계되었다. 베이지안 최적화 절차를 통해 밀집 네트워크(Dense), 순환 신경망(RNN) 및 합성곱 신경망(CNN)을 포함한 다양한 아키텍처를 최적화하여 에너지 분해능과 네트워크 규모 간의 균형을 달성했다. 최적화된 Dense, CNN 및 Dense+RNN 조합 아키텍처는 약 80 MeV의 횡단 에너지 분해능을 달성하여 현재 사용 중인 최적 필터(OF) 방법과 유사한 복잡도의 RNN을 크게 능가한다. 전체 동적 범위에 대한 상세 비교는 Dense, CNN 및 Dense+RNN이 에너지 스케일을 정확히 재현하는 반면, OF와 RNN은 에너지를 과소평가함을 보여준다. 또한 Dense 아키텍처에서 심층 증거 회귀를 구현하여 신뢰할 수 있는 사건별 에너지 불확실성 요구사항을 충족했다.
본 논문은 ATLAS 실험 설계, LHC 업그레이드 계획, FPGA 신경망 구현, 심층 증거 회귀 이론 등 핵심 분야를 포괄하는 28편의 중요 참고문헌을 인용하여 연구에 견고한 이론 및 기술 기초를 제공한다.
종합 평가: 이는 이론 혁신과 공학 실천 간 양호한 균형을 달성한 고품질 응용 연구 논문이다. 연구는 주요 과학 장비 업그레이드 요구사항에 직접 기여하며, 방법 설계가 합리적이고 실험 검증이 충분하여 고에너지 물리학 실험 및 FPGA 응용 분야 모두에 중요한 가치를 지닌다.