2025-11-15T03:43:11.771522

Uniformly most powerful tests in linear models

Romanescu

In the multiple regression model we prove that the coefficient t-test for a variable of interest is uniformly most powerful unbiased, with the other parameters considered nuisance. The proof is based on the theory of tests with Neyman-structure and does not assume unbiasedness or linearity of the test statistic. We further show that the Gram-Schmidt decomposition of the design matrix leads to a family of regression model with potentially more powerful tests for the corresponding transformed regressors. Finally, we discuss interpretation and performance criteria for the Gram-Schmidt regression compared to standard multiple regression, and show how the power differential has major implications for study design.

academic

रैखिक मॉडल में समान रूप से सबसे शक्तिशाली परीक्षण

मूल जानकारी

पेपर ID: 2411.18033
शीर्षक: रैखिक मॉडल में समान रूप से सबसे शक्तिशाली परीक्षण
लेखक: Razvan G. Romanescu (मैनिटोबा विश्वविद्यालय)
वर्गीकरण: math.ST stat.TH
पत्रिका: जर्नल ऑफ द रॉयल स्टैटिस्टिकल सोसाइटी (प्रकाशनाधीन)
पेपर लिंक: https://arxiv.org/abs/2411.18033

सारांश

यह पेपर बहुभिन्न प्रतिगमन मॉडल में रुचि के चर के गुणांक t-परीक्षण को समान रूप से सबसे शक्तिशाली निष्पक्ष (UMPU) साबित करता है, जहां अन्य पैरामीटर को विघ्नकारी पैरामीटर माना जाता है। प्रमाण Neyman संरचना वाले परीक्षण सिद्धांत पर आधारित है, जो परीक्षण सांख्यिकी की निष्पक्षता या रैखिकता को मानता नहीं है। आगे दिखाया गया है कि डिजाइन मैट्रिक्स का Gram-Schmidt अपघटन प्रतिगमन मॉडल की एक श्रृंखला की ओर ले जाता है, जिसमें संबंधित रूपांतरित प्रतिगमन के लिए संभावित रूप से मजबूत परीक्षण शक्ति होती है। अंत में, Gram-Schmidt प्रतिगमन और मानक बहुभिन्न प्रतिगमन की व्याख्या और प्रदर्शन मानदंडों पर चर्चा की गई है, और शक्ति अंतर के अनुसंधान डिजाइन पर महत्वपूर्ण प्रभाव को दर्शाया गया है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

बहुसंरेखता समस्या: बहुभिन्न प्रतिगमन में संबंधित भविष्यवाणी चर शक्ति हानि और अन्य समस्याओं का कारण बनते हैं। चरम मामलों में, पूरी तरह से संबंधित भविष्यवाणी चर अति-पहचाने गए मॉडल को फिट करने में विफल करते हैं।
मौजूदा सिद्धांत की सीमाएं: बहुभिन्न प्रतिगमन की सैद्धांतिक चर्चा मुख्य रूप से OLS अनुमानकों के गुणों (BLUE और BUE) पर केंद्रित है, लेकिन अभी भी मूल प्रतिगमन चर स्थान के भीतर है, बहुसंरेखता की व्यावहारिक समस्याओं को हल नहीं करता है।
परीक्षण सिद्धांत में खाली स्थान: हालांकि यह ज्ञात है कि पर्याप्त सांख्यिकी पर आधारित निष्पक्ष अनुमानक अद्वितीय UMVUE हैं, लेकिन ऐसे अनुमानकों पर आधारित परीक्षण UMP हैं या नहीं यह सहज नहीं है।

अनुसंधान प्रेरणा

सैद्धांतिक पूर्णता: बहुभिन्न प्रतिगमन में गुणांक t-परीक्षण के UMP गुण को स्पष्ट रूप से साबित करना
व्यावहारिक अनुप्रयोग: Gram-Schmidt रूपांतरण के माध्यम से बहुसंरेखता को संभालने के लिए नई विधि प्रदान करना
शक्ति वृद्धि: व्याख्या क्षमता को बनाए रखते हुए परीक्षण शक्ति में सुधार करना

मुख्य योगदान

सैद्धांतिक प्रमाण: बहुभिन्न प्रतिगमन में गुणांक t-परीक्षण के UMPU गुण को पहली बार औपचारिक रूप से साबित करना
विधि नवाचार: Gram-Schmidt अपघटन पर आधारित प्रतिगमन रूपांतरण विधि प्रस्तावित करना, जो भविष्यवाणी चर के बीच सहसंबंध को पूरी तरह से समाप्त करता है
शक्ति विश्लेषण: नई बहुसंरेखता माप Δ स्थापित करना, जो GS प्रतिगमन के सापेक्ष मानक प्रतिगमन की शक्ति लाभ को मापता है
अनुप्रयोग मार्गदर्शन: अनुसंधान डिजाइन के लिए नमूना आकार गणना के लिए सैद्धांतिक आधार प्रदान करना, शक्ति अंतर के व्यावहारिक महत्व को दर्शाना

विधि विवरण

कार्य परिभाषा

बहुभिन्न प्रतिगमन मॉडल पर विचार करें: $Y = \beta_1x_1 + \beta_2x_2 + \ldots + \beta_px_p + \epsilon$ जहां $\epsilon \sim N(0, \sigma^2I)$ , लक्ष्य रुचि के पैरामीटर $\beta_i$ पर परिकल्पना परीक्षण करना है: $H_0: \beta_i \leq 0 \quad \text{vs} \quad H_1: \beta_i > 0$

सैद्धांतिक ढांचा

1. ऑर्थोगोनल भविष्यवाणी चर के लिए UMPU परीक्षण

प्रमेय 1: जब भविष्यवाणी चर $x_1, x_2, \ldots, x_p$ ऑर्थोगोनल रूप से मानकीकृत हों, तो परीक्षण $\phi = \begin{cases} 0, & \text{यदि } V < t_{n-p,1-\alpha} \\ 1, & \text{यदि } V \geq t_{n-p,1-\alpha} \end{cases}$ जहां $V = \frac{\sqrt{n-p}x_p^TY}{\sqrt{Y^TY - \sum_{i=1}^p(x_i^TY)^2}} \sim t_{n-p}$ , $H_0: \beta_p \leq 0$ का परीक्षण करने के लिए UMPU परीक्षण है।

2. Gram-Schmidt रूपांतरण

एल्गोरिथ्म 1: पहली दिशा के चारों ओर Gram-Schmidt ऑर्थोगोनलाइजेशन

पहला आधार वेक्टर निर्धारित करें: $x_1 = \frac{m_1}{\|m_1\|}$
$k = 2$ $k = 2$ से $p$ $p$ के लिए:
- $m_k$ को पहले से प्राप्त आधार वेक्टर पर प्रतिगमन करें: $m_k = \alpha_{k,1}x_1 + \ldots + \alpha_{k,k-1}x_{k-1} + r_k$
- अगला आधार वेक्टर सेट करें: $x_k = \frac{\hat{r}_k}{\|\hat{r}_k\|}$
- मैट्रिक्स $Q$ का $k$ -वां स्तंभ गणना करें

3. संबंधित भविष्यवाणी चर के लिए UMPU परीक्षण

प्रमेय 2: OLS अनुमान पर आधारित एकतरफा गुणांक t-परीक्षण बहुभिन्न प्रतिगमन में UMPU है।

प्रमाण डिजाइन मैट्रिक्स $M$ के GS अपघटन का निर्माण करके, मूल मॉडल को ऑर्थोगोनल रूप में पुनः पैरामीटर करके, और फिर प्रमेय 1 के परिणाम को लागू करके किया जाता है।

तकनीकी नवाचार बिंदु

सैद्धांतिक विधि: Neyman संरचना परीक्षण सिद्धांत का उपयोग करना, परीक्षण सांख्यिकी की निष्पक्षता धारणा पर निर्भर नहीं है
रूपांतरण रणनीति: GS अपघटन के माध्यम से चर की आंशिक व्याख्या क्षमता बनाए रखना, प्रमुख घटक विश्लेषण से बेहतर है
शक्ति माप: $\Delta = \frac{\beta_1\|q_1\|}{q_1^T\beta}$ को बहुसंरेखता प्रभाव के व्यापक माप के रूप में प्रस्तुत करना

प्रयोगात्मक सेटअप

सिमुलेशन प्रयोग

डेटा जनन प्रक्रिया:

स्वतंत्र चर: $M_1 = Z_1$ , $M_i = \rho Z_1 + Z_i$ (i=2,...,p)
परिणाम चर: $Y = \frac{1}{p}M_1 + \ldots + \frac{1}{p}M_p + \sigma\epsilon$
पैरामीटर सेटिंग: $\rho \in \{-0.25, 0.25, 0.5\}$ , $\sigma \in [1, \infty)$ , $p \in \{3, 5, 15\}$
नमूना आकार: $n = 200$ , $N = 1000$ बार दोहराया गया

वास्तविक डेटा

McDonald और Schwing (1973) की वायु प्रदूषण और मृत्यु दर डेटासेट का उपयोग:

15 भविष्यवाणी चर (प्रदूषक, सामाजिक जनसांख्यिकी, मौसम संबंधी चर)
ऑर्थोगोनलाइजेशन क्रम: SO2, HC, NOx, फिर सामाजिक जनसांख्यिकी, अंत में मौसम संबंधी चर

तुलना विधियां

मानक बहुभिन्न प्रतिगमन
Gram-Schmidt प्रतिगमन
रिज प्रतिगमन ( $k_{K12}$ ट्यूनिंग रणनीति का उपयोग करके)

प्रयोगात्मक परिणाम

मुख्य परिणाम

1. शक्ति तुलना (चित्र 1)

सकारात्मक सहसंबंध ( $\rho > 0$ ): GS प्रतिगमन मानक प्रतिगमन और रिज प्रतिगमन से काफी बेहतर है
नकारात्मक सहसंबंध ( $\rho < 0$ ): GS प्रतिगमन शक्ति में कमी
शक्ति वृद्धि: $\rho$ और $p$ बढ़ने के साथ, GS विधि का लाभ अधिक स्पष्ट है
विभेदन मानदंड: $\Delta$ मान शक्ति अंतर को वफादारी से प्रतिबिंबित करता है, $\Delta > 1$ होने पर GS मानक प्रतिगमन से बेहतर है

2. वायु प्रदूषण डेटा विश्लेषण (तालिका 1)

मानक प्रतिगमन बनाम GS प्रतिगमन परिणाम तुलना:

SO2: p-मान 2.91e-05 से 4.52e-07 तक सुधारा गया
HC: गैर-महत्वपूर्ण से 9.36e-05 (अत्यधिक महत्वपूर्ण) में परिवर्तित
NOx: गैर-महत्वपूर्ण से 0.0011 (महत्वपूर्ण) में परिवर्तित

विभिन्न ऑर्थोगोनलाइजेशन क्रम की मजबूती (तालिका 2):

6 क्रमपरिवर्तन में, कम से कम एक प्रदूषक चर प्रत्येक फिटिंग में उच्च महत्वपूर्ण रहता है
महत्व स्तर मूल अनुसंधान में SO2 के स्तर से अधिक है
विधि की चर क्रम के प्रति सापेक्ष मजबूती को सत्यापित करता है

सैद्धांतिक परिणाम

प्रमेय 4: शक्ति तुलना के लिए आवश्यक और पर्याप्त शर्त

GS प्रतिगमन शक्ति अधिक है यदि और केवल यदि: $\beta_i > \frac{q_i^T\beta}{\|q_i\|}$
समान शक्ति नमूना आकार संबंध: $\frac{n_A}{n_B} = \Delta_i^2$ ( $\alpha_i, \beta_i$ समान चिन्ह होने पर)

प्रस्ताव 3: GS प्रतिगमन में प्रभाव आकार अनुमान $\frac{\hat{\beta}_i}{\|\hat{r}_i\|} \sim N\left(\frac{\beta_i}{Q_{ii}}, \frac{\sigma^2}{Q_{ii}^2}\right)$

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

सैद्धांतिक योगदान: मानक t-परीक्षण के UMPU गुण को साबित करता है, प्रतिगमन परीक्षण सिद्धांत में खाली स्थान को भरता है
विधि योगदान: GS रूपांतरण बहुसंरेखता को संभालने के लिए एक प्रभावी मार्ग प्रदान करता है, उपयुक्त परिस्थितियों में शक्ति में काफी सुधार करता है
व्यावहारिक मूल्य: नई माप $\Delta$ अनुसंधान डिजाइन और नमूना आकार गणना के लिए सैद्धांतिक आधार प्रदान करती है

सीमाएं

क्रम निर्भरता: GS विधि की व्याख्या ऑर्थोगोनलाइजेशन क्रम पर निर्भर करती है, पूर्व ज्ञान या स्वतंत्र जांच की आवश्यकता है
अनुप्रयोग शर्तें: शक्ति वृद्धि मुख्य रूप से सकारात्मक सहसंबंधित भविष्यवाणी चर के मामले में महत्वपूर्ण है
कारण धारणा: प्रभाव आकार व्याख्या को उचित संभावित कारक मॉडल समर्थन की आवश्यकता है

भविष्य की दिशाएं

मॉडल विस्तार: भविष्यवाणी चर के सबसेट को एक साथ कार्य करने की अनुमति देना, अधिक कारण संरचना को मैप करना
क्रम चयन: डेटा-संचालित इष्टतम ऑर्थोगोनलाइजेशन क्रम चयन विधि विकसित करना
अनुप्रयोग विस्तार: अन्य रैखिक मॉडल में अनुप्रयोग संभावना की खोज करना

गहन मूल्यांकन

शक्तियां

सैद्धांतिक कठोरता: परिपक्व Neyman संरचना परीक्षण सिद्धांत पर आधारित, प्रमाण प्रक्रिया पूर्ण और सख्त है
व्यावहारिक मूल्य: ठोस संख्यात्मक उदाहरण और सिमुलेशन साक्ष्य प्रदान करता है, विधि की व्यावहारिक प्रभावशीलता को दर्शाता है
नवाचार: शास्त्रीय GS अपघटन को आधुनिक सांख्यिकीय परीक्षण सिद्धांत के साथ संयोजित करता है, नई अंतर्दृष्टि उत्पन्न करता है
लेखन स्पष्टता: पेपर संरचना पूर्ण है, सिद्धांत से अनुप्रयोग तक स्तर स्पष्ट है

कमियां

धारणा सीमाएं: सामान्यता धारणा काफी मजबूत है, वास्तविक डेटा संतुष्ट नहीं हो सकता है
कम्प्यूटेशनल जटिलता: उच्च-आयामी समस्याओं के लिए, GS अपघटन की संख्यात्मक स्थिरता समस्या हो सकती है
व्याख्या चुनौती: हालांकि आंशिक व्याख्या क्षमता बनाए रखता है, रूपांतरित गुणांक व्याख्या अभी भी सावधानीपूर्वक की जानी चाहिए

प्रभाव

सैद्धांतिक योगदान: प्रतिगमन विश्लेषण के परीक्षण सिद्धांत के लिए महत्वपूर्ण पूरक प्रदान करता है
व्यावहारिक मार्गदर्शन: बहुसंरेखता को संभालने के लिए नए उपकरण और दृष्टिकोण प्रदान करता है
अंतः-विषय अनुप्रयोग: अर्थशास्त्र, जैव-सांख्यिकी आदि क्षेत्रों में व्यापक अनुप्रयोग संभावना है

लागू परिदृश्य

गंभीर बहुसंरेखता: पारंपरिक विधि शक्ति अपर्याप्त होने वाले उच्च सहसंबंधित भविष्यवाणी चर परिदृश्य
कारण अनुमान: स्पष्ट चर क्रम या कारण संबंध वाले अनुसंधान
शक्ति-संवेदनशील: नैदानिक परीक्षण या नीति मूल्यांकन अनुसंधान जहां परीक्षण शक्ति के लिए उच्च आवश्यकता है

संदर्भ

Bhattacharya, P. and Burman, P. (2016). सिद्धांत और सांख्यिकी की विधियां। Elsevier.
Hoerl, A. E. and Kennard, R. W. (1970). रिज प्रतिगमन: गैर-ऑर्थोगोनल समस्याओं के लिए पक्षपाती अनुमान। Technometrics, 12(1):55–67.
King, M. L. and Smith, M. D. (1986). रैखिक प्रतिगमन गुणांक के संयुक्त एकतरफा परीक्षण। Journal of Econometrics, 32(3):367–383.
Lehmann, E. and Romano, J. P. (2022). सांख्यिकीय परिकल्पना का परीक्षण। Springer International Publishing.

यह पेपर सिद्धांत और विधि दोनों में महत्वपूर्ण योगदान देता है, बहुभिन्न प्रतिगमन विश्लेषण के लिए नया सैद्धांतिक आधार और व्यावहारिक उपकरण प्रदान करता है। कुछ सीमाओं के बावजूद, इसकी नवाचार और व्यावहारिक मूल्य इसे सांख्यिकी और अनुप्रयुक्त क्षेत्रों में महत्वपूर्ण कार्य बनाती है।