In the multiple regression model we prove that the coefficient t-test for a variable of interest is uniformly most powerful unbiased, with the other parameters considered nuisance. The proof is based on the theory of tests with Neyman-structure and does not assume unbiasedness or linearity of the test statistic. We further show that the Gram-Schmidt decomposition of the design matrix leads to a family of regression model with potentially more powerful tests for the corresponding transformed regressors. Finally, we discuss interpretation and performance criteria for the Gram-Schmidt regression compared to standard multiple regression, and show how the power differential has major implications for study design.
academic
Test uniformemente più potenti nei modelli lineari
Il presente articolo dimostra che il test t sui coefficienti delle variabili di interesse nei modelli di regressione multivariata è uniformemente più potente imparziale (UMPU), considerando gli altri parametri come parametri di disturbo. La dimostrazione si basa sulla teoria dei test con struttura di Neyman, senza assumere l'imparzialità o la linearità della statistica di test. Inoltre, viene mostrato come la decomposizione di Gram-Schmidt della matrice di progettazione conduce a una serie di modelli di regressione con potenza di test potenzialmente più forte per i corrispondenti regressori trasformati. Infine, vengono discussi i criteri di interpretazione e prestazione della regressione di Gram-Schmidt rispetto alla regressione multivariata standard, evidenziando l'impatto significativo delle differenze di potenza sulla progettazione dello studio.
Problema della multicollinearità: Le variabili predittive correlate nella regressione multivariata causano perdita di potenza e altri problemi. In casi estremi, variabili predittive completamente correlate portano a modelli sovra-identificati che non possono essere adattati.
Limitazioni della teoria esistente: La discussione teorica della regressione multivariata si concentra principalmente sulle proprietà degli stimatori OLS (BLUE e BUE), ma rimane nello spazio dei regressori originali, senza affrontare i problemi pratici della multicollinearità.
Lacuna nella teoria dei test: Sebbene sia noto che gli stimatori imparziali basati su statistiche sufficienti sono gli unici UMVUE, non è intuitivo se i test basati su tali stimatori siano UMP.
Dimostrazione teorica: Prima dimostrazione formale che il test t sui coefficienti nella regressione multivariata è un test UMPU
Innovazione metodologica: Propone un metodo di trasformazione della regressione basato sulla decomposizione di Gram-Schmidt che elimina completamente la correlazione tra variabili predittive
Analisi della potenza: Stabilisce una nuova misura della multicollinearità Δ, quantificando il vantaggio di potenza della regressione GS rispetto alla regressione standard
Guida applicativa: Fornisce una base teorica per il calcolo della dimensione del campione nella progettazione dello studio, evidenziando il significato pratico delle differenze di potenza
Considerare il modello di regressione multivariata:
Y=β1x1+β2x2+…+βpxp+ϵ
dove ϵ∼N(0,σ2I), e l'obiettivo è condurre un test di ipotesi sul parametro di interesse βi:
H0:βi≤0vsH1:βi>0
Teorema 1: Quando le variabili predittive x1,x2,…,xp sono ortonormalizzate, il test
ϕ={0,1,se V<tn−p,1−αse V≥tn−p,1−α
dove V=YTY−∑i=1p(xiTY)2n−pxpTY∼tn−p, è un test UMPU per H0:βp≤0.
Teorema 2: Il test t unilaterale sui coefficienti basato sulla stima OLS è UMPU nella regressione multivariata.
La dimostrazione procede costruendo la decomposizione GS della matrice di progettazione M, riparametrizzando il modello originale in forma ortogonale, quindi applicando i risultati del Teorema 1.
Metodo teorico: Utilizza la teoria dei test con struttura di Neyman, senza dipendere dall'assunzione di imparzialità della statistica di test
Strategia di trasformazione: Mantiene l'interpretabilità parziale delle variabili attraverso la decomposizione GS, superiore all'analisi delle componenti principali
Misura della potenza: Introduce Δ=q1Tββ1∥q1∥ come misura comprensiva dell'impatto della multicollinearità
Contributo teorico: Dimostra la proprietà UMPU del test t standard, colmando una lacuna nella teoria dei test di regressione
Contributo metodologico: La trasformazione GS fornisce un approccio efficace per affrontare la multicollinearità, migliorando significativamente la potenza in condizioni appropriate
Valore pratico: La nuova misura Δ fornisce una base teorica per la progettazione dello studio e il calcolo della dimensione del campione
Dipendenza dall'ordine: L'interpretazione del metodo GS dipende dall'ordine di ortonormalizzazione, richiedendo conoscenze preliminari o indagini indipendenti
Condizioni di applicabilità: Il miglioramento della potenza è principalmente significativo nel caso di variabili predittive positivamente correlate
Assunzioni causali: L'interpretazione della dimensione dell'effetto richiede un modello di fattori latenti ragionevole
Bhattacharya, P. and Burman, P. (2016). Theory and Methods of Statistics. Elsevier.
Hoerl, A. E. and Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1):55–67.
King, M. L. and Smith, M. D. (1986). Joint one-sided tests of linear regression coefficients. Journal of Econometrics, 32(3):367–383.
Lehmann, E. and Romano, J. P. (2022). Testing Statistical Hypotheses. Springer International Publishing.
Questo articolo fornisce importanti contributi sia dal punto di vista teorico che metodologico, offrendo una nuova base teorica e strumenti pratici per l'analisi di regressione multivariata. Nonostante alcune limitazioni, la sua innovatività e il suo valore pratico lo rendono un lavoro importante per la statistica e i campi applicati.