In the multiple regression model we prove that the coefficient t-test for a variable of interest is uniformly most powerful unbiased, with the other parameters considered nuisance. The proof is based on the theory of tests with Neyman-structure and does not assume unbiasedness or linearity of the test statistic. We further show that the Gram-Schmidt decomposition of the design matrix leads to a family of regression model with potentially more powerful tests for the corresponding transformed regressors. Finally, we discuss interpretation and performance criteria for the Gram-Schmidt regression compared to standard multiple regression, and show how the power differential has major implications for study design.
In dieser Arbeit wird nachgewiesen, dass der t-Test für Koeffizienten von Variablen von Interesse in multivariaten Regressionsmodellen gleichmäßig beste unverzerrte (UMPU) ist, wobei andere Parameter als Störparameter behandelt werden. Der Beweis basiert auf der Testtheorie mit Neyman-Struktur und setzt weder Unverzerrtheit noch Linearität der Teststatistik voraus. Darüber hinaus wird gezeigt, dass die Gram-Schmidt-Zerlegung der Designmatrix zu einer Reihe von Regressionsmodellen führt, die potenziell stärkere Testmacht für die entsprechenden transformierten Regressoren aufweisen. Abschließend werden die Interpretation und Leistungsstandards der Gram-Schmidt-Regression und der standardmäßigen multivariaten Regression erörtert, und es wird demonstriert, dass Unterschiede in der Testmacht bedeutende Auswirkungen auf die Studienplanung haben.
Multikollinearitätsproblem: Korrelierte Prädiktorvariablen in der multivariaten Regression führen zu Machtverlusten und anderen Problemen. In extremen Fällen führen vollständig korrelierte Prädiktorvariablen zu überidentifizierten Modellen, die nicht angepasst werden können.
Grenzen der bestehenden Theorie: Die theoretische Diskussion der multivariaten Regression konzentriert sich hauptsächlich auf die Eigenschaften von OLS-Schätzern (BLUE und BUE), bleibt aber im ursprünglichen Regressorraum stecken und löst das praktische Problem der Multikollinearität nicht.
Lücke in der Testtheorie: Obwohl bekannt ist, dass unverzerrte Schätzer basierend auf suffizienten Statistiken eindeutig UMVUE sind, ist nicht unmittelbar klar, ob Tests basierend auf solchen Schätzern UMP sind.
Theoretischer Beweis: Erstmaliger formaler Nachweis, dass der Koeffizient-t-Test in der multivariaten Regression ein UMPU-Test ist
Methodische Innovation: Vorschlag einer auf Gram-Schmidt-Zerlegung basierenden Regressionstransformationsmethode, die Korrelationen zwischen Prädiktorvariablen vollständig eliminiert
Machtanalyse: Etablierung eines neuen Multikollinearitätsmaßes Δ, das den Machtvorteil der GS-Regression gegenüber der Standardregression quantifiziert
Anwendungsleitfaden: Bereitstellung einer theoretischen Grundlage für die Stichprobenumfangsberechnung in der Studienplanung, Demonstration der praktischen Bedeutung von Machtunterschieden
Betrachten Sie das multivariate Regressionsmodell:
Y=β1x1+β2x2+…+βpxp+ϵ
wobei ϵ∼N(0,σ2I), und das Ziel ist, Hypothesentests für den Parameter von Interesse βi durchzuführen:
H0:βi≤0vsH1:βi>0
Theorem 1: Wenn die Prädiktorvariablen x1,x2,…,xp orthonormal sind, ist der Test
ϕ={0,1,wenn V<tn−p,1−αwenn V≥tn−p,1−α
wobei V=YTY−∑i=1p(xiTY)2n−pxpTY∼tn−p, ein UMPU-Test für H0:βp≤0.
Theorem 2: Der einseitige Koeffizient-t-Test basierend auf OLS-Schätzung ist in der multivariaten Regression UMPU.
Der Beweis wird durch Konstruktion der GS-Zerlegung der Designmatrix M durchgeführt, wobei das ursprüngliche Modell in orthogonale Form reparametrisiert wird, und dann werden die Ergebnisse von Theorem 1 angewendet.
Theoretische Methode: Verwendung der Neyman-Struktur-Testtheorie, unabhängig von der Unverzerrtheit der Teststatistik
Transformationsstrategie: Beibehaltung der teilweisen Interpretierbarkeit von Variablen durch GS-Zerlegung, überlegen gegenüber der Hauptkomponentenanalyse
Machtmaß: Einführung von Δ=q1Tββ1∥q1∥ als umfassendes Maß für die Auswirkung von Multikollinearität
Theoretischer Beitrag: Nachweis der UMPU-Eigenschaft des Standard-t-Tests, Schließung einer Lücke in der Regressionstesttheorie
Methodischer Beitrag: GS-Transformation bietet einen effektiven Weg zur Behandlung von Multikollinearität und verbessert die Testmacht unter angemessenen Bedingungen erheblich
Praktischer Wert: Das neue Maß Δ bietet eine theoretische Grundlage für Studienplanung und Stichprobenumfangsberechnung
Reihenfolgeabhängigkeit: Die Interpretation der GS-Methode hängt von der Orthogonalisierungsreihenfolge ab und erfordert Vorwissen oder unabhängige Untersuchung
Anwendungsbedingungen: Machtverbesserung ist hauptsächlich bei positiv korrelierten Prädiktorvariablen signifikant
Kausalannahmen: Die Interpretation der Effektgröße erfordert ein angemessenes latentes Faktormodell
Bhattacharya, P. and Burman, P. (2016). Theory and Methods of Statistics. Elsevier.
Hoerl, A. E. and Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1):55–67.
King, M. L. and Smith, M. D. (1986). Joint one-sided tests of linear regression coefficients. Journal of Econometrics, 32(3):367–383.
Lehmann, E. and Romano, J. P. (2022). Testing Statistical Hypotheses. Springer International Publishing.
Diese Arbeit leistet wichtige Beiträge in Theorie und Methodik und bietet eine neue theoretische Grundlage und praktische Werkzeuge für die multivariate Regressionsanalyse. Trotz einiger Einschränkungen machen ihre Innovativität und praktischer Wert sie zu einer wichtigen Arbeit in Statistik und angewandten Bereichen.