Quantifying Uncertainty: All We Need is the Bootstrap?
Zrimšek, Štrumbelj
A critical literature review and comprehensive simulation study is used to show that (a) non-parametric bootstrap is a viable alternative to commonly taught and used methods in basic estimation tasks (mean, variance, quartiles, correlation) and (b), contrary to recommendations in most related work, double bootstrap performs better than BCa. Quantifying uncertainty through standard errors, confidence intervals, hypothesis tests, and related measures is a fundamental aspect of statistical practice. However, these techniques involve a variety of methods, mathematical formulas, and underlying concepts, which can be complex. Could the non-parametric bootstrap, known for its simplicity and general applicability, serve as a universal alternative? This paper addresses this question through a review of the existing literature and a simulation analysis of one- and two-sided confidence intervals across varying sample sizes, confidence levels, data-generating processes, and statistical functionals. Results show that the double bootstrap consistently performs best and is a promising alternative to traditional methods used for common statistical tasks. These results suggest that the bootstrap, particularly the double bootstrap, could simplify statistical education and practice without compromising effectiveness.
academic
Quantificare l'Incertezza: È Sufficiente il Bootstrap?
Questo studio, attraverso una revisione critica della letteratura e uno studio di simulazione completo, dimostra che: (a) il metodo bootstrap non parametrico è un'alternativa praticabile ai metodi convenzionali per compiti di stima fondamentali (media, varianza, quantili, correlazione); (b) contrariamente alle raccomandazioni della maggior parte della ricerca correlata, il double bootstrap supera il metodo BCa. Lo studio, attraverso revisione della letteratura e analisi di simulazione, esamina se il bootstrap non parametrico può fungere da metodo universale per la quantificazione dell'incertezza, dimostrando che il double bootstrap presenta le prestazioni migliori, semplificando l'insegnamento statistico e la pratica senza perdita di validità.
Il problema centrale che questo studio affronta è: Il bootstrap non parametrico può fungere da soluzione "one-stop" per la quantificazione dell'incertezza?
Sfide Educative Reali: Professionisti in scienze sociali, medicina e scienze biologiche ricevono tipicamente solo 1-2 corsi di statistica applicata, ma devono condurre numerose analisi statistiche
Complessità Metodologica: I metodi tradizionali di quantificazione dell'incertezza coinvolgono formule matematiche e concetti complessi, portando facilmente ad applicazioni meccaniche e errori
Crisi Scientifica: L'uso improprio di metodi statistici è un fattore importante nella crisi di riproducibilità scientifica
Revisione Empirica più Completa del Bootstrap: Revisione sistematica della ricerca empirica correlata dal 1981-2023
Esperimento di Simulazione su Larga Scala: Copre 1.386 combinazioni di parametri, includendo diverse dimensioni campionarie, livelli di confidenza, processi di generazione dei dati e funzioni statistiche
Nuovo Standard di Valutazione: Propone uno standard di valutazione della qualità degli intervalli di confidenza basato sulla divergenza KL
Scoperta Rivoluzionaria: Dimostra che il double bootstrap supera il metodo BCa ampiamente raccomandato
Significato Didattico: Fornisce supporto empirico per la riforma dell'insegnamento statistico
L'obiettivo della ricerca è valutare le prestazioni del bootstrap non parametrico nella costruzione di intervalli di confidenza, includendo specificamente:
Input: Dati campionari da diverse distribuzioni
Output: Intervalli di confidenza per varie funzioni statistiche
Vincoli: Metodi non parametrici, senza assunzioni distributive
Innovazione negli Standard di Valutazione: Propone uno standard di valutazione basato sulla divergenza KL, superando la natura fuorviante della valutazione tradizionale della copertura bilaterale
Completezza: Prima comparazione sistematica di vari metodi bootstrap in combinazioni di parametri così ampie
Orientamento Pratico: Focalizzazione su situazioni di piccoli campioni comuni nella pratica
DB presenta ugualmente le migliori prestazioni negli intervalli di confidenza bilaterali, soprattutto quando n≥64 soddisfa quasi tutti gli standard rigorosi.
L'articolo cita 54 importanti riferimenti bibliografici, coprendo le basi teoriche del bootstrap, la ricerca empirica e i casi di applicazione, fornendo una base bibliografica solida per la ricerca. I riferimenti chiave includono i documenti originali sul bootstrap di Efron, il manuale classico di Davison & Hinkley e i recenti studi di confronto empirico.
Valutazione Complessiva: Questo è uno studio di metodologia statistica di alta qualità che, attraverso esperimenti di simulazione su larga scala, sfida la saggezza tradizionale della comunità statistica, fornendo un supporto solido per l'applicazione del bootstrap nell'insegnamento statistico e nella pratica. La progettazione della ricerca è rigorosa e le conclusioni hanno significato teorico e pratico importante, sebbene vi sia ancora spazio per miglioramenti nell'interpretazione teorica e nell'estensione metodologica.