Criterion for the resemblance between the mother and the model distribution
Sheena
If the probability distribution model aims to approximate the hidden mother distribution, it is imperative to establish a useful criterion for the resemblance between the mother and the model distributions.
This study proposes a criterion that measures the Hellinger distance between discretized (quantized) samples from both distributions. Unlike information criteria such as AIC, this criterion does not require the probability density function of the model distribution, which cannot be explicitly obtained for a complicated model such as a deep learning machine. Second, it can draw a positive conclusion (i.e., both distributions are sufficiently close) under a given threshold, whereas a statistical hypothesis test, such as the Kolmogorov-Smirnov test, cannot genuinely lead to a positive conclusion when the hypothesis is accepted.
In this study, we establish a reasonable threshold for the criterion deduced from the Bayes error rate and also present the asymptotic bias of the estimator of the criterion. From these results, a reasonable and easy-to-use criterion is established that can be directly calculated from the two sets of samples from both distributions.
academic
Критерий сходства между исходным и модельным распределением
В данной работе исследуется проблема измерения сходства между моделью вероятностного распределения и истинным распределением данных (исходным распределением). Предложен критерий, основанный на расстоянии Хеллингера дискретизированных выборок, который не требует явной функции плотности вероятности модельного распределения и поэтому применим к сложным моделям, таким как глубокое обучение. В отличие от традиционных тестов гипотез (например, теста Колмогорова-Смирнова), предложенный критерий позволяет сделать положительный вывод о том, что «два распределения достаточно близки» при заданном пороге. Исследование устанавливает обоснованный порог на основе байесовской ошибки классификации и предоставляет асимптотический анализ смещения оценки критерия.
Когда модель вероятностного распределения предназначена для аппроксимации неизвестного истинного распределения данных (исходного распределения), установление эффективного критерия сходства является фундаментальной проблемой. Это особенно важно при оценке генеративных моделей (таких как глубокие генеративные модели, байесовские модели).
Потребность в оценке моделей: В машинном обучении и статистическом моделировании необходимо определить, достаточно ли хорошо сгенерированная модель аппроксимирует истинное распределение данных
Практическое значение: Определение достаточности обучения, пригодности параметрической модели, адекватности размера выборки и других практических вопросов
Теоретическая ценность: Предоставление интерпретируемого количественного стандарта для сходства распределений
Предложен двухвыборочный критерий на основе дискретизированного расстояния Хеллингера: Путём дискретизации (квантизации) выборок из двух распределений сравниваются расстояния Хеллингера на уровне полиномиальных распределений
Установлена теоретическая связь с байесовской ошибкой классификации (теорема 1): Доказана связь между f-дивергенцией и байесовской ошибкой классификации, что придаёт значению дивергенции практическую интерпретируемость
Выведены обоснованные стандарты порога: На основе байесовской ошибки классификации выведен порог расстояния Хеллингера δ* = 8ϵ², где ϵ соответствует отклонению ошибки от случайного угадывания
Предложен метод дискретизации с подвижными областями: По сравнению с методом фиксированных областей имеет лучшую асимптотическую эффективность порядка n⁻² (теоремы 2 и 3)
Предоставлен анализ асимптотического смещения оценки (теорема 4): Доказано, что верхняя граница смещения оценки EDm⁽¹⁾ : m⁽²⁾ составляет EDm̂⁽¹⁾ : m̂⁽²⁾ + √(8p'/n₂) + o(n₁⁻¹) + o(n₂⁻¹/²)
Установлена общая связь между f-дивергенцией и байесовской ошибкой классификации (теорема 1), обеспечивающая интуитивную интерпретацию значения дивергенции через ошибку классификации
Доказана асимптотическая превосходство метода подвижных областей в задаче с одной выборкой (теоремы 2, 3)
Методологические инновации:
Использование метода подвижных областей вместо фиксированных для повышения эффективности оценки
Выбор расстояния Хеллингера для избежания проблем с нулевыми оценками (не расходится при -1 < α < 1)
Использование выборки модели X⁽²⁾ для построения областей (так как обычно n₂ >> n₁)
Анализ смещения:
Теорема 4 предоставляет верхнюю границу асимптотического смещения оценки
Влияние n₂ имеет порядок n₂⁻¹/², влияние n₁ имеет порядок n₁⁻¹
Это объясняет, почему требуется относительно большой размер n₂
Практический критерий:
Предоставлен полный критерий с коррекцией смещения (формула 40)
Порог 8ϵ² имеет чёткое статистическое значение (соответствует байесовской ошибке классификации)
Amari (2016): Information Geometry and Its Applications - информационно-геометрическая основа f-дивергенции
Csiszár (1975): Основополагающая работа по f-дивергенции
Gretton et al. (2007): Применение ядровых методов в двухвыборочном тестировании
Richardson and Weiss (2018): Наиболее близкий метод, использующий метод фиксированных областей
Sheena (2018): Предыдущая работа автора, доказывающая превосходство метода подвижных областей в скалярном случае
Theis et al. (2015): Сравнительное исследование методов оценки генеративных моделей
Borji (2018): Полный обзор метрик оценки генеративно-состязательных сетей
Общая оценка: Это высокого качества статья с строгой теорией и практичным методом. Ключевая инновация заключается во введении байесовской ошибки классификации в установку порога дивергенции, придающем абстрактному статистическому показателю интуитивную интерпретацию. Метод особенно подходит для оценки сложных моделей без явной функции плотности, заполняя важный пробел в этой области. Основные ограничения заключаются в неполноте теории высокомерного случая и ограниченном охвате экспериментов, но это не влияет на её академическую ценность и практичность. Рекомендуется читателям при применении обратить внимание на требования к размеру выборки (особенно n₂) и ограничения размерности, при необходимости применяя стратегии снижения размерности.