We introduce the \textit{almost goodness-of-fit} test, a procedure to assess whether a (parametric) model provides a good representation of the probability distribution generating the observed sample. Specifically, given a distribution function $F$ and a parametric family $\mathcal{G}=\{ G(\boldsymbolθ) : \boldsymbolθ \in Î\}$, we consider the testing problem \[ H_0: \| F - G(\boldsymbolθ_F) \|_p \geq ε\quad \text{vs} \quad H_1: \| F - G(\boldsymbolθ_F) \|_p < ε, \] where $ε>0$ is a margin of error and $G(\boldsymbolθ_F)$ denotes a representative of $F$ within the parametric class. The approximate model is determined via an M-estimator of the parameters. %The objective is the approximate validation of a distribution or an entire parametric family up to a pre-specified threshold value. The methodology also quantifies the percentage improvement of the proposed model relative to a non-informative (constant) benchmark. The test statistic is the $\mathrm{L}^p$-distance between the empirical distribution function and that of the estimated model. We present two consistent, easy-to-implement, and flexible bootstrap schemes to carry out the test. The performance of the proposal is illustrated through simulation studies and analysis and real-data applications.
academic
Pruebas bootstrap para bondad de ajuste aproximada
Este artículo introduce la prueba de "bondad de ajuste aproximada" (almost goodness-of-fit, AGoF) para evaluar si un modelo paramétrico representa adecuadamente la distribución de probabilidad de una muestra observada. Específicamente, dada una función de distribución F y una familia paramétrica G={G(θ):θ∈Θ}, se considera el problema de prueba de hipótesis:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
donde ϵ>0 es la tolerancia de error, y G(θF) representa el elemento de la clase paramétrica más cercano a F. El modelo aproximado se determina mediante estimación M, y se proporcionan dos esquemas bootstrap consistentes y fáciles de implementar para realizar la prueba.
Las pruebas tradicionales de bondad de ajuste presentan un problema fundamental: colocan la afirmación "el modelo es una aproximación razonable de los datos" en la hipótesis nula H0, por lo que solo pueden proporcionar evidencia estadística de "falta de ajuste" del modelo, sin poder proporcionar evidencia de "bondad de ajuste" real.
Limitaciones de las pruebas GoF tradicionales: Los métodos clásicos solo pueden rechazar el modelo, sin poder verificar su aplicabilidad
Necesidades prácticas: En la práctica, nos interesa más si el modelo es "suficientemente bueno" que si es perfectamente exacto
Importancia del modelado aproximado: En la realidad, pocos modelos pueden describir perfectamente los datos, por lo que es necesario tolerar cierto grado de desviación
Propuesta del marco de prueba AGoF: Coloca el "ajuste aproximado" en la hipótesis alternativa, permitiendo proporcionar evidencia estadística de la aplicabilidad del modelo
Uso de distancia Lp: En comparación con la norma supremo tradicional, la norma Lp posee mejores propiedades teóricas y ventajas computacionales
Desarrollo de dos esquemas bootstrap: Se demuestra su consistencia y se proporcionan algoritmos de implementación práctica
Introducción del estadístico AGoF: Cuantifica el porcentaje de mejora del modelo en relación con una línea base no informativa
Análisis teórico completo: Incluye distribución asintótica, consistencia bootstrap y otras garantías teóricas
Dada una muestra X1,…,Xn de una distribución desconocida F y una familia de modelos paramétricos G={G(θ):θ∈Θ⊂Rk}, se prueba:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
donde θF se determina mediante estimación M: EF[ψθF(X)]=0.
Diferenciabilidad de Hadamard: Para 1<p<∞, la norma Lp es diferenciable en el sentido de Hadamard, facilitando la aplicación del método delta funcional
Límite Gaussiano: Bajo supuestos generales, la distribución asintótica es gaussiana
Consistencia Bootstrap: Bajo condiciones apropiadas, el estimador bootstrap estándar es consistente
Flexibilidad: Ajustando el valor de p se puede controlar la sensibilidad a las colas de la distribución
Efectividad del método: La prueba AGoF resuelve exitosamente el problema de que las pruebas GoF tradicionales solo pueden proporcionar evidencia de "falta de ajuste"
Completitud teórica: Se proporciona una teoría asintótica completa y prueba de consistencia bootstrap
Practicidad: Los dos esquemas bootstrap son fáciles de implementar y aplicables a una amplia gama de modelos paramétricos
El artículo cita una abundante literatura relacionada que abarca teoría de procesos empíricos, estimación M, métodos bootstrap y otros campos importantes, proporcionando una base teórica sólida para la investigación.