We introduce the \textit{almost goodness-of-fit} test, a procedure to assess whether a (parametric) model provides a good representation of the probability distribution generating the observed sample. Specifically, given a distribution function $F$ and a parametric family $\mathcal{G}=\{ G(\boldsymbolθ) : \boldsymbolθ \in Î\}$, we consider the testing problem \[ H_0: \| F - G(\boldsymbolθ_F) \|_p \geq ε\quad \text{vs} \quad H_1: \| F - G(\boldsymbolθ_F) \|_p < ε, \] where $ε>0$ is a margin of error and $G(\boldsymbolθ_F)$ denotes a representative of $F$ within the parametric class. The approximate model is determined via an M-estimator of the parameters. %The objective is the approximate validation of a distribution or an entire parametric family up to a pre-specified threshold value. The methodology also quantifies the percentage improvement of the proposed model relative to a non-informative (constant) benchmark. The test statistic is the $\mathrm{L}^p$-distance between the empirical distribution function and that of the estimated model. We present two consistent, easy-to-implement, and flexible bootstrap schemes to carry out the test. The performance of the proposal is illustrated through simulation studies and analysis and real-data applications.
Questo articolo introduce il test di "quasi-bontà di adattamento" (almost goodness-of-fit, AGoF) per valutare se un modello parametrico rappresenta adeguatamente la distribuzione di probabilità di un campione osservato. Specificamente, data una funzione di distribuzione F e una famiglia parametrica G={G(θ):θ∈Θ}, si considera il problema di verifica di ipotesi:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
dove ϵ>0 è la tolleranza di errore e G(θF) rappresenta il rappresentante di F nella classe parametrica. Il modello approssimato è determinato tramite M-stimatori e vengono forniti due schemi bootstrap coerenti e facili da implementare per eseguire il test.
I test tradizionali di bontà di adattamento presentano un problema fondamentale: pongono l'affermazione "il modello è una ragionevole approssimazione dei dati" nell'ipotesi nulla H0, fornendo quindi solo evidenza statistica della "non adattamento" del modello, senza poter fornire evidenza della vera "bontà di adattamento".
Limitazioni dei test GoF tradizionali: I metodi classici possono solo rifiutare il modello, non verificarne l'applicabilità
Esigenze Pratiche: In pratica, siamo più interessati a sapere se il modello è "sufficientemente buono" piuttosto che perfettamente preciso
Importanza della Modellazione Approssimata: Nella realtà, raramente i modelli descrivono perfettamente i dati; è necessario tollerare un certo grado di deviazione
Propone il quadro di test AGoF: Posiziona l'"adattamento approssimato" nell'ipotesi alternativa, fornendo evidenza statistica dell'applicabilità del modello
Utilizza la distanza Lp: Rispetto alla norma supremo tradizionale, la norma Lp possiede migliori proprietà teoriche e vantaggi computazionali
Sviluppa due schemi bootstrap: Dimostra la loro coerenza e fornisce algoritmi di implementazione pratica
Introduce la statistica AGoF: Quantifica la percentuale di miglioramento del modello rispetto a un riferimento non informativo
Fornisce un'analisi teorica completa: Inclusa la distribuzione asintotica, la coerenza bootstrap e altre garanzie teoriche
Dato un campione X1,…,Xn da una distribuzione sconosciuta F e una famiglia di modelli parametrici G={G(θ):θ∈Θ⊂Rk}, si verifica:
H0:∥F−G(θF)∥p≥ϵvsH1:∥F−G(θF)∥p<ϵ
dove θF è determinato tramite M-stima: EF[ψθF(X)]=0.
Innovazione Teorica: Primo approccio sistematico a posizionare l'"adattamento approssimato" nell'ipotesi alternativa, con importante rottura concettuale
Completezza Metodologica: L'analisi teorica e gli algoritmi di implementazione sono molto completi
Valore Pratico: La statistica AGoF fornisce una misura intuitiva della qualità del modello
Vantaggi Tecnici: La scelta della distanza Lp presenta evidenti vantaggi sia teorici che computazionali
L'articolo cita una ricca letteratura correlata, coprendo importanti lavori in più aree quali la teoria dei processi empirici, gli M-stimatori, i metodi bootstrap e altri, fornendo una base teorica solida per la ricerca.