Generative networks are perfect tools to enhance the speed and precision of LHC simulations. It is important to understand their statistical precision, especially when generating events beyond the size of the training dataset. We present two complementary methods to estimate the amplification factor without large holdout datasets. Averaging amplification uses Bayesian networks or ensembling to estimate amplification from the precision of integrals over given phase-space volumes. Differential amplification uses hypothesis testing to quantify amplification without any resolution loss. Applied to state-of-the-art event generators, both methods indicate that amplification is possible in specific regions of phase space, but not yet across the entire distribution.
Генеративные сети являются идеальным инструментом для повышения скорости и точности моделирования на БАК. Особенно важно понимать их статистическую точность при генерировании событий, выходящих за пределы масштаба обучающего набора данных. В данной работе предложены два взаимодополняющих метода для оценки коэффициента амплификации без использования больших резервных наборов данных. Средняя амплификация использует байесовские сети или ансамблевые методы для оценки амплификации на основе точности, интегрированной по заданному объёму фазового пространства. Дифференциальная амплификация использует проверку гипотез для количественной оценки амплификации без потери разрешения. При применении к современным генераторам событий оба метода показывают, что амплификация может быть достигнута в определённых областях фазового пространства.
Вычислительные вызовы: Высоколюминесцентный БАК (HL-LHC) увеличит объём данных на порядок, требуя соответствующего увеличения точности и количества смоделированных данных, однако вычислительный бюджет далеко не достаточен.
Концепция генеративной амплификации: Генеративная амплификация означает, что набор данных, полученный путём выборки из генеративной сети, может обеспечить лучшее описание истинного распределения по сравнению с обучающими данными. Это явление основано на способности генеративной сети интерполировать базовую плотность.
Предоставить систематическую основу для количественной оценки статистической амплификации генеративных сетей без больших резервных наборов данных
Обеспечить надёжное количественное определение неопределённости для приложений генеративных сетей в физике БАК
Решить две основные проблемы: понимание того, как использовать генеративные сети для моделирования, и предоставление нижней границы статистической неопределённости для сгенерированных наборов данных
Учитывая обучающий набор данных Dtruentrain∼ptrue(x), генеративная сеть изучает плотность pgen(x). Коэффициент амплификации определяется как:
G=ntrainnequiv
где nequiv — число эквивалентных событий, удовлетворяющих:
M[Dtruenequiv,ptrue]=limngen→∞M[Dgenngen,ptrue]
Измерение согласованности сгенерированных данных с истинным распределением путём интегрирования по определённому объёму фазового пространства V:
I(ptrue)=∫Vdxptrue(x)
Общая неопределённость содержит две части:
MI[Dgenngen,ptrue]={σstat2(ngen)σstat2(ngen)+σmodel2(pgen,ptrue)еслиpgen=ptrueеслиpgen=ptrue
Использование выходных данных обученного классификатора в качестве одномерной сводной статистики, которая согласно лемме Неймана-Пирсона является наиболее мощной сводной статистикой.
Чувствительность сводной статистики: радиальная сводная статистика R показывает более высокий коэффициент амплификации (G≈22), в то время как статистика отношения правдоподобия не показывает амплификации
Эффект размерности: эффект амплификации ослабевает в 4D случае, отражая сложность обучения в высоких размерностях
Проверка осуществимости: в определённых областях фазового пространства современные генеративные сети действительно могут достичь статистической амплификации
Эффективность методов: оба предложенных метода эффективно оценивают коэффициент амплификации без больших резервных наборов данных
Важность архитектуры: архитектуры, эквивариантные по Лоренцу, показывают лучшую производительность в генерации событий на БАК
Теоретическая строгость: обеспечивает математически строгое определение и основу оценки генеративной амплификации
Практическая ценность: решает ключевые потребности в практических физических приложениях без больших резервных наборов данных
Методологические инновации: два взаимодополняющих метода имеют свои преимущества, средний метод прост и интуитивен, дифференциальный метод сохраняет разрешение
Достаточная проверка: систематическая проверка от простых игрушечных моделей к сложным физическим процессам
Статья содержит богатую библиографию, охватывающую приложения машинного обучения в физике БАК, генеративные сети, байесовские методы и количественное определение неопределённости в соответствующих областях. Особого внимания заслуживают пионерские работы авторского коллектива по GANplification и последние исследования архитектур сетей, эквивариантных по Лоренцу.