In the multiple regression model we prove that the coefficient t-test for a variable of interest is uniformly most powerful unbiased, with the other parameters considered nuisance. The proof is based on the theory of tests with Neyman-structure and does not assume unbiasedness or linearity of the test statistic. We further show that the Gram-Schmidt decomposition of the design matrix leads to a family of regression model with potentially more powerful tests for the corresponding transformed regressors. Finally, we discuss interpretation and performance criteria for the Gram-Schmidt regression compared to standard multiple regression, and show how the power differential has major implications for study design.
academic
Pruebas uniformemente más potentes en modelos lineales
En este artículo se demuestra que la prueba t sobre los coeficientes de variables de interés en modelos de regresión multivariada es uniformemente más potente e insesgada (UMPU), tratando los otros parámetros como parámetros de molestia. La demostración se basa en la teoría de pruebas con estructura de Neyman, sin asumir la insesgadez o linealidad del estadístico de prueba. Se muestra además que la descomposición de Gram-Schmidt de la matriz de diseño genera una serie de modelos de regresión que potencialmente producen pruebas más potentes para los regresores transformados correspondientes. Finalmente, se discuten los criterios de interpretación y desempeño entre la regresión de Gram-Schmidt y la regresión multivariada estándar, demostrando el impacto significativo de las diferencias de potencia en el diseño de investigación.
Problema de multicolinealidad: Las variables predictoras correlacionadas en regresión multivariada causan pérdida de potencia y otros problemas. En casos extremos, variables predictoras completamente correlacionadas resultan en modelos sobreidentificados que no pueden ajustarse.
Limitaciones de la teoría existente: La discusión teórica de la regresión multivariada se ha centrado principalmente en las propiedades del estimador OLS (BLUE y BUE), pero permanece dentro del espacio de regresores originales, sin resolver los problemas prácticos de multicolinealidad.
Vacío en la teoría de pruebas: Aunque se sabe que los estimadores insesgados basados en estadísticos suficientes son los únicos UMVUE, no es intuitivo si las pruebas basadas en tales estimadores son UMP.
Demostración teórica: Primera demostración formal de que las pruebas t de coeficientes en regresión multivariada son pruebas UMPU
Innovación metodológica: Proponer un método de transformación de regresión basado en descomposición de Gram-Schmidt que elimina completamente la correlación entre variables predictoras
Análisis de potencia: Establecer una nueva medida de multicolinealidad Δ que cuantifica la ventaja de potencia de la regresión GS sobre la regresión estándar
Orientación aplicada: Proporcionar base teórica para el cálculo del tamaño de muestra en diseño de investigación, demostrando la importancia práctica de las diferencias de potencia
Considérese el modelo de regresión multivariada:
Y=β1x1+β2x2+…+βpxp+ϵ
donde ϵ∼N(0,σ2I), y el objetivo es realizar pruebas de hipótesis sobre el parámetro de interés βi:
H0:βi≤0vsH1:βi>0
Teorema 1: Cuando las variables predictoras x1,x2,…,xp están estandarizadas y ortogonales, la prueba
ϕ={0,1,si V<tn−p,1−αsi V≥tn−p,1−α
donde V=YTY−∑i=1p(xiTY)2n−pxpTY∼tn−p, es una prueba UMPU para H0:βp≤0.
Teorema 2: La prueba t unilateral de coeficientes basada en estimación OLS es UMPU en regresión multivariada.
La demostración se realiza mediante la construcción de la descomposición GS de la matriz de diseño M, reparametrizando el modelo original en forma ortogonal, y luego aplicando los resultados del Teorema 1.
Método teórico: Utilizar la teoría de pruebas con estructura de Neyman, sin depender de supuestos de insesgadez del estadístico de prueba
Estrategia de transformación: Mediante descomposición GS se mantiene la interpretabilidad parcial de las variables, superior al análisis de componentes principales
Medida de potencia: Introducir Δ=q1Tββ1∥q1∥ como medida integral del impacto de la multicolinealidad
Contribución teórica: Se demuestra la propiedad UMPU de la prueba t estándar, llenando el vacío en la teoría de pruebas de regresión
Contribución metodológica: La transformación GS proporciona un camino efectivo para abordar la multicolinealidad, mejorando significativamente la potencia bajo condiciones apropiadas
Valor práctico: La nueva medida Δ proporciona base teórica para el diseño de investigación y cálculo del tamaño de muestra
Dependencia del orden: La interpretación del método GS depende del orden de ortogonalización, requiriendo conocimiento previo o investigación independiente
Condiciones de aplicabilidad: La mejora de potencia es principalmente significativa en casos de variables predictoras correlacionadas positivamente
Supuestos causales: La interpretación del tamaño de efecto requiere un modelo de factores latentes potenciales razonable
Bhattacharya, P. and Burman, P. (2016). Theory and Methods of Statistics. Elsevier.
Hoerl, A. E. and Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1):55–67.
King, M. L. and Smith, M. D. (1986). Joint one-sided tests of linear regression coefficients. Journal of Econometrics, 32(3):367–383.
Lehmann, E. and Romano, J. P. (2022). Testing Statistical Hypotheses. Springer International Publishing.
Este artículo realiza contribuciones importantes tanto en teoría como en metodología, proporcionando nuevas bases teóricas y herramientas prácticas para el análisis de regresión multivariada. A pesar de algunas limitaciones, su innovación y valor práctico lo convierten en un trabajo importante para la estadística y campos aplicados.