Generative networks are perfect tools to enhance the speed and precision of LHC simulations. It is important to understand their statistical precision, especially when generating events beyond the size of the training dataset. We present two complementary methods to estimate the amplification factor without large holdout datasets. Averaging amplification uses Bayesian networks or ensembling to estimate amplification from the precision of integrals over given phase-space volumes. Differential amplification uses hypothesis testing to quantify amplification without any resolution loss. Applied to state-of-the-art event generators, both methods indicate that amplification is possible in specific regions of phase space, but not yet across the entire distribution.
जनरेटिव नेटवर्क LHC अनुकरण की गति और सटीकता को बढ़ाने के लिए आदर्श उपकरण हैं। विशेष रूप से प्रशिक्षण डेटासेट के आकार से अधिक घटनाओं को उत्पन्न करते समय, उनकी सांख्यिकीय सटीकता को समझना अत्यंत महत्वपूर्ण है। यह पेपर बड़े होल्डआउट डेटासेट की आवश्यकता के बिना प्रवर्धन कारक का अनुमान लगाने के लिए दो पूरक विधियों का प्रस्ताव करता है। औसत प्रवर्धन बेयेसियन नेटवर्क या समेकन विधियों का उपयोग करके दिए गए चरण-स्थान आयतन पर एकीकृत सटीकता से प्रवर्धन का अनुमान लगाता है। अंतर प्रवर्धन परिकल्पना परीक्षण का उपयोग करके प्रवर्धन को परिमाणित करता है और कोई संकल्प हानि नहीं करता है। अत्याधुनिक घटना जनरेटर पर लागू, दोनों विधियां दर्शाती हैं कि विशिष्ट चरण-स्थान क्षेत्रों में प्रवर्धन प्राप्त किया जा सकता है।
कम्प्यूटेशनल चुनौती: उच्च-चमक LHC (HL-LHC) डेटा मात्रा को एक दशक से बढ़ाएगा, जिसके लिए अनुकरण डेटा की सटीकता और मात्रा में समान वृद्धि की आवश्यकता है, लेकिन कम्प्यूटेशनल बजट इस मांग को पूरा करने में सक्षम नहीं है।
जनरेटिव प्रवर्धन की अवधारणा: जनरेटिव प्रवर्धन से तात्पर्य है कि जनरेटिव नेटवर्क से नमूना किया गया डेटासेट प्रशिक्षण डेटा की तुलना में वास्तविक वितरण का बेहतर विवरण प्रदान कर सकता है। यह घटना अंतर्निहित घनत्व के प्रति जनरेटिव नेटवर्क की प्रक्षेप क्षमता पर आधारित है।
जनरेटिव नेटवर्क के सांख्यिकीय प्रवर्धन को परिमाणित करने के लिए एक व्यवस्थित ढांचा प्रदान करना, बड़े होल्डआउट डेटासेट की आवश्यकता के बिना
LHC भौतिकी में जनरेटिव नेटवर्क के अनुप्रयोग के लिए विश्वसनीय अनिश्चितता परिमाणीकरण प्रदान करना
दो मुख्य चिंताओं को संबोधित करना: यह समझना कि अनुकरण के लिए जनरेटिव नेटवर्क का उपयोग कैसे करें, और जनरेटिव डेटासेट की सांख्यिकीय अनिश्चितता के लिए निचली सीमा प्रदान करना
प्रशिक्षण डेटासेट Dtruentrain∼ptrue(x) दिया गया, जनरेटिव नेटवर्क घनत्व pgen(x) सीखता है। प्रवर्धन कारक को इस प्रकार परिभाषित किया जाता है:
G=ntrainnequiv
जहां nequiv समतुल्य घटनाओं की संख्या है, जो संतुष्ट करती है:
M[Dtruenequiv,ptrue]=limngen→∞M[Dgenngen,ptrue]
प्रशिक्षित वर्गीकारक आउटपुट को 1-आयामी सारांश सांख्यिकी के रूप में उपयोग करना, न्यूमैन-पियर्सन लेम्मा के अनुसार, यह सबसे शक्तिशाली सारांश सांख्यिकी है।
पेपर में मशीन लर्निंग के LHC भौतिकी में अनुप्रयोग, जनरेटिव नेटवर्क, बेयेसियन विधियां और अनिश्चितता परिमाणीकरण सहित संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए समृद्ध संदर्भ हैं। विशेष रूप से ध्यान देने योग्य लेखक टीम का GANplification में पिछला अग्रणी कार्य और लोरेंत्ज़ समतुल्य नेटवर्क आर्किटेक्चर पर नवीनतम अनुसंधान है।