We introduce the \textit{almost goodness-of-fit} test, a procedure to assess whether a (parametric) model provides a good representation of the probability distribution generating the observed sample. Specifically, given a distribution function $F$ and a parametric family $\mathcal{G}=\{ G(\boldsymbolθ) : \boldsymbolθ \in Î\}$, we consider the testing problem \[ H_0: \| F - G(\boldsymbolθ_F) \|_p \geq ε\quad \text{vs} \quad H_1: \| F - G(\boldsymbolθ_F) \|_p < ε, \] where $ε>0$ is a margin of error and $G(\boldsymbolθ_F)$ denotes a representative of $F$ within the parametric class. The approximate model is determined via an M-estimator of the parameters. %The objective is the approximate validation of a distribution or an entire parametric family up to a pre-specified threshold value. The methodology also quantifies the percentage improvement of the proposed model relative to a non-informative (constant) benchmark. The test statistic is the $\mathrm{L}^p$-distance between the empirical distribution function and that of the estimated model. We present two consistent, easy-to-implement, and flexible bootstrap schemes to carry out the test. The performance of the proposal is illustrated through simulation studies and analysis and real-data applications.
academic
Бутстреп-тесты для почти согласованности распределения
В данной работе предлагается тест "почти согласованности распределения" (almost goodness-of-fit, AGoF) для оценки того, насколько хорошо параметрическая модель представляет вероятностное распределение наблюдаемой выборки. Конкретно, для функции распределения F и параметрического семейства G={G(θ):θ∈Θ} рассматривается задача проверки гипотез:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
где ϵ>0 — допустимая погрешность, G(θF) — представитель F в параметрическом классе. Приближённая модель определяется через M-оценки, и предложены два согласованных и легко реализуемых бутстреп-метода для проведения теста.
Традиционные тесты согласованности распределения имеют фундаментальный недостаток: они помещают утверждение "модель является разумным приближением данных" в нулевую гипотезу H0, поэтому могут предоставить статистическое свидетельство только "несогласованности" модели, но не могут подтвердить фактическую "согласованность".
Ограничения традиционных тестов GoF: классические методы могут только отвергнуть модель, но не могут подтвердить её применимость
Практические потребности: на практике нас больше интересует, является ли модель "достаточно хорошей", чем является ли она абсолютно точной
Важность приближённого моделирования: в реальности редко встречаются модели, идеально описывающие данные; необходимо допускать определённую степень отклонения
Предложена схема теста AGoF: "приближённая согласованность" помещается в альтернативную гипотезу, что позволяет предоставить статистическое свидетельство применимости модели
Использование Lp-расстояния: по сравнению с традиционной супремум-нормой, Lp-норма обладает лучшими теоретическими свойствами и вычислительными преимуществами
Разработка двух бутстреп-методов: доказана их согласованность и предложены практические алгоритмы реализации
Введение статистики AGoF: количественно измеряет процент улучшения модели относительно неинформативного базового уровня
Полный теоретический анализ: включает асимптотические распределения, согласованность бутстреп-методов и другие теоретические гарантии
Дана выборка X1,…,Xn из неизвестного распределения F и параметрическое семейство моделей G={G(θ):θ∈Θ⊂Rk}. Требуется проверить:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
где θF определяется через M-оценку: EF[ψθF(X)]=0.
Теоретическая инновация: впервые систематически помещает "приближённую согласованность" в альтернативную гипотезу, что представляет важный концептуальный прорыв
Методологическая полнота: от теоретического анализа до алгоритмов реализации всё очень полно
Практическая ценность: статистика AGoF предоставляет интуитивную меру качества модели
Технические преимущества: выбор Lp-расстояния имеет явные преимущества как в теории, так и в вычислениях
Статья ссылается на богатую литературу по смежным вопросам, охватывающую теорию эмпирических процессов, M-оценки, методы бутстреп и другие важные работы в этих областях, обеспечивая прочную теоретическую базу для исследования.