In the multiple regression model we prove that the coefficient t-test for a variable of interest is uniformly most powerful unbiased, with the other parameters considered nuisance. The proof is based on the theory of tests with Neyman-structure and does not assume unbiasedness or linearity of the test statistic. We further show that the Gram-Schmidt decomposition of the design matrix leads to a family of regression model with potentially more powerful tests for the corresponding transformed regressors. Finally, we discuss interpretation and performance criteria for the Gram-Schmidt regression compared to standard multiple regression, and show how the power differential has major implications for study design.
academic
Равномерно наиболее мощные тесты в линейных моделях
В данной работе доказывается, что t-тест коэффициента переменной интереса в многомерной модели регрессии является равномерно наиболее мощным несмещённым (UMPU) тестом, когда остальные параметры рассматриваются как мешающие параметры. Доказательство основано на теории тестирования с структурой Неймана без предположений о несмещённости или линейности тестовой статистики. Далее показано, что разложение Грама-Шмидта матрицы плана приводит к серии моделей регрессии с потенциально более высокой мощностью тестов для соответствующих преобразованных регрессоров. Наконец, обсуждаются критерии интерпретации и производительности регрессии Грама-Шмидта и стандартной многомерной регрессии, демонстрируя значительное влияние различий в мощности на планирование исследований.
Проблема мультиколлинеарности: Коррелированные предикторы в многомерной регрессии приводят к потере мощности и другим проблемам. В экстремальных случаях полностью коррелированные предикторы приводят к переопределённым моделям, которые невозможно подогнать.
Ограничения существующей теории: Теоретическое обсуждение многомерной регрессии сосредоточено главным образом на свойствах OLS-оценок (BLUE и BUE), но остаётся в пространстве исходных регрессоров, не решая практические проблемы мультиколлинеарности.
Пробел в теории тестирования: Хотя известно, что несмещённые оценки, основанные на достаточных статистиках, являются единственными UMVUE, неочевидно, являются ли тесты, основанные на таких оценках, UMP-тестами.
Теоретическое доказательство: Первое формальное доказательство того, что t-тест коэффициента в многомерной регрессии является UMPU-тестом
Методологическое инновация: Предложение метода преобразования регрессии на основе разложения Грама-Шмидта, полностью устраняющего корреляцию между предикторами
Анализ мощности: Установление нового показателя мультиколлинеарности Δ, количественно определяющего преимущество в мощности регрессии GS по сравнению со стандартной регрессией
Практическое руководство: Предоставление теоретической основы для расчёта объёма выборки при планировании исследований, демонстрирующей практическое значение различий в мощности
Рассмотрим многомерную модель регрессии:
Y=β1x1+β2x2+…+βpxp+ϵ
где ϵ∼N(0,σ2I), и целью является проверка гипотез о параметре интереса βi:
H0:βi≤0vsH1:βi>0
Теорема 1: Когда предикторы x1,x2,…,xp ортогональны и нормализованы, тест
ϕ={0,1,еслиV<tn−p,1−αеслиV≥tn−p,1−α
где V=YTY−∑i=1p(xiTY)2n−pxpTY∼tn−p, является UMPU-тестом для H0:βp≤0.
Теорема 2: Односторонний t-тест коэффициента, основанный на OLS-оценке, является UMPU-тестом в многомерной регрессии.
Доказательство осуществляется путём построения GS-разложения матрицы плана M, переформулирования исходной модели в ортогональную форму и применения результата теоремы 1.
Теоретический вклад: Доказательство UMPU-свойства стандартного t-теста, заполнение пробела в теории регрессионного тестирования
Методологический вклад: Преобразование GS предоставляет эффективный способ обработки мультиколлинеарности, значительно повышая мощность при надлежащих условиях
Практическая ценность: Новая мера Δ предоставляет теоретическую основу для планирования исследований и расчёта объёма выборки
Bhattacharya, P. and Burman, P. (2016). Theory and Methods of Statistics. Elsevier.
Hoerl, A. E. and Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1):55–67.
King, M. L. and Smith, M. D. (1986). Joint one-sided tests of linear regression coefficients. Journal of Econometrics, 32(3):367–383.
Lehmann, E. and Romano, J. P. (2022). Testing Statistical Hypotheses. Springer International Publishing.
Данная статья вносит важные вклады как в теорию, так и в методологию, предоставляя новую теоретическую основу и практические инструменты для анализа многомерной регрессии. Несмотря на некоторые ограничения, её инновационность и практическая ценность делают её значительной работой в области статистики и прикладных наук.