यह पेपर बहुभिन्न प्रतिगमन मॉडल में रुचि के चर के गुणांक t-परीक्षण को समान रूप से सबसे शक्तिशाली निष्पक्ष (UMPU) साबित करता है, जहां अन्य पैरामीटर को विघ्नकारी पैरामीटर माना जाता है। प्रमाण Neyman संरचना वाले परीक्षण सिद्धांत पर आधारित है, जो परीक्षण सांख्यिकी की निष्पक्षता या रैखिकता को मानता नहीं है। आगे दिखाया गया है कि डिजाइन मैट्रिक्स का Gram-Schmidt अपघटन प्रतिगमन मॉडल की एक श्रृंखला की ओर ले जाता है, जिसमें संबंधित रूपांतरित प्रतिगमन के लिए संभावित रूप से मजबूत परीक्षण शक्ति होती है। अंत में, Gram-Schmidt प्रतिगमन और मानक बहुभिन्न प्रतिगमन की व्याख्या और प्रदर्शन मानदंडों पर चर्चा की गई है, और शक्ति अंतर के अनुसंधान डिजाइन पर महत्वपूर्ण प्रभाव को दर्शाया गया है।
बहुभिन्न प्रतिगमन मॉडल पर विचार करें: जहां , लक्ष्य रुचि के पैरामीटर पर परिकल्पना परीक्षण करना है:
प्रमेय 1: जब भविष्यवाणी चर ऑर्थोगोनल रूप से मानकीकृत हों, तो परीक्षण
0, & \text{यदि } V < t_{n-p,1-\alpha} \\ 1, & \text{यदि } V \geq t_{n-p,1-\alpha} \end{cases}$$ जहां $V = \frac{\sqrt{n-p}x_p^TY}{\sqrt{Y^TY - \sum_{i=1}^p(x_i^TY)^2}} \sim t_{n-p}$, $H_0: \beta_p \leq 0$ का परीक्षण करने के लिए UMPU परीक्षण है। #### 2. Gram-Schmidt रूपांतरण **एल्गोरिथ्म 1**: पहली दिशा के चारों ओर Gram-Schmidt ऑर्थोगोनलाइजेशन 1. पहला आधार वेक्टर निर्धारित करें: $x_1 = \frac{m_1}{\|m_1\|}$ 2. $k = 2$ से $p$ के लिए: - $m_k$ को पहले से प्राप्त आधार वेक्टर पर प्रतिगमन करें: $m_k = \alpha_{k,1}x_1 + \ldots + \alpha_{k,k-1}x_{k-1} + r_k$ - अगला आधार वेक्टर सेट करें: $x_k = \frac{\hat{r}_k}{\|\hat{r}_k\|}$ - मैट्रिक्स $Q$ का $k$-वां स्तंभ गणना करें #### 3. संबंधित भविष्यवाणी चर के लिए UMPU परीक्षण **प्रमेय 2**: OLS अनुमान पर आधारित एकतरफा गुणांक t-परीक्षण बहुभिन्न प्रतिगमन में UMPU है। प्रमाण डिजाइन मैट्रिक्स $M$ के GS अपघटन का निर्माण करके, मूल मॉडल को ऑर्थोगोनल रूप में पुनः पैरामीटर करके, और फिर प्रमेय 1 के परिणाम को लागू करके किया जाता है। ### तकनीकी नवाचार बिंदु 1. **सैद्धांतिक विधि**: Neyman संरचना परीक्षण सिद्धांत का उपयोग करना, परीक्षण सांख्यिकी की निष्पक्षता धारणा पर निर्भर नहीं है 2. **रूपांतरण रणनीति**: GS अपघटन के माध्यम से चर की आंशिक व्याख्या क्षमता बनाए रखना, प्रमुख घटक विश्लेषण से बेहतर है 3. **शक्ति माप**: $\Delta = \frac{\beta_1\|q_1\|}{q_1^T\beta}$ को बहुसंरेखता प्रभाव के व्यापक माप के रूप में प्रस्तुत करना ## प्रयोगात्मक सेटअप ### सिमुलेशन प्रयोग **डेटा जनन प्रक्रिया**: - स्वतंत्र चर: $M_1 = Z_1$, $M_i = \rho Z_1 + Z_i$ (i=2,...,p) - परिणाम चर: $Y = \frac{1}{p}M_1 + \ldots + \frac{1}{p}M_p + \sigma\epsilon$ - पैरामीटर सेटिंग: $\rho \in \{-0.25, 0.25, 0.5\}$, $\sigma \in [1, \infty)$, $p \in \{3, 5, 15\}$ - नमूना आकार: $n = 200$, $N = 1000$ बार दोहराया गया ### वास्तविक डेटा McDonald और Schwing (1973) की वायु प्रदूषण और मृत्यु दर डेटासेट का उपयोग: - 15 भविष्यवाणी चर (प्रदूषक, सामाजिक जनसांख्यिकी, मौसम संबंधी चर) - ऑर्थोगोनलाइजेशन क्रम: SO2, HC, NOx, फिर सामाजिक जनसांख्यिकी, अंत में मौसम संबंधी चर ### तुलना विधियां 1. मानक बहुभिन्न प्रतिगमन 2. Gram-Schmidt प्रतिगमन 3. रिज प्रतिगमन ($k_{K12}$ ट्यूनिंग रणनीति का उपयोग करके) ## प्रयोगात्मक परिणाम ### मुख्य परिणाम #### 1. शक्ति तुलना (चित्र 1) - **सकारात्मक सहसंबंध** ($\rho > 0$): GS प्रतिगमन मानक प्रतिगमन और रिज प्रतिगमन से काफी बेहतर है - **नकारात्मक सहसंबंध** ($\rho < 0$): GS प्रतिगमन शक्ति में कमी - **शक्ति वृद्धि**: $\rho$ और $p$ बढ़ने के साथ, GS विधि का लाभ अधिक स्पष्ट है - **विभेदन मानदंड**: $\Delta$ मान शक्ति अंतर को वफादारी से प्रतिबिंबित करता है, $\Delta > 1$ होने पर GS मानक प्रतिगमन से बेहतर है #### 2. वायु प्रदूषण डेटा विश्लेषण (तालिका 1) **मानक प्रतिगमन बनाम GS प्रतिगमन परिणाम तुलना**: - SO2: p-मान 2.91e-05 से 4.52e-07 तक सुधारा गया - HC: गैर-महत्वपूर्ण से 9.36e-05 (अत्यधिक महत्वपूर्ण) में परिवर्तित - NOx: गैर-महत्वपूर्ण से 0.0011 (महत्वपूर्ण) में परिवर्तित **विभिन्न ऑर्थोगोनलाइजेशन क्रम की मजबूती** (तालिका 2): - 6 क्रमपरिवर्तन में, कम से कम एक प्रदूषक चर प्रत्येक फिटिंग में उच्च महत्वपूर्ण रहता है - महत्व स्तर मूल अनुसंधान में SO2 के स्तर से अधिक है - विधि की चर क्रम के प्रति सापेक्ष मजबूती को सत्यापित करता है ### सैद्धांतिक परिणाम **प्रमेय 4**: शक्ति तुलना के लिए आवश्यक और पर्याप्त शर्त - GS प्रतिगमन शक्ति अधिक है यदि और केवल यदि: $\beta_i > \frac{q_i^T\beta}{\|q_i\|}$ - समान शक्ति नमूना आकार संबंध: $\frac{n_A}{n_B} = \Delta_i^2$ ($\alpha_i, \beta_i$ समान चिन्ह होने पर) **प्रस्ताव 3**: GS प्रतिगमन में प्रभाव आकार अनुमान $$\frac{\hat{\beta}_i}{\|\hat{r}_i\|} \sim N\left(\frac{\beta_i}{Q_{ii}}, \frac{\sigma^2}{Q_{ii}^2}\right)$$ ## संबंधित कार्य ### मौजूदा अनुसंधान 1. **UMP परीक्षण सिद्धांत**: King और Smith (1986) ने UMPI परीक्षण का निर्माण किया, लेकिन मजबूत अपरिवर्तनीयता धारणा की आवश्यकता है 2. **रिज प्रतिगमन**: Hoerl और Kennard (1970) ने पक्षपाती अनुमान के माध्यम से स्थिरता में सुधार किया 3. **स्पर्शोन्मुख सिद्धांत**: Choi et al. (1996) ने बड़े नमूने की सीमा में पैरामीट्रिक मॉडल के लिए प्रभावी परीक्षण समस्या को हल किया ### इस पेपर के लाभ 1. **सटीकता**: सीमित नमूने के लिए सटीक परिणाम प्रदान करता है, स्पर्शोन्मुख सन्निकटन नहीं 2. **सरलता**: बंद-रूप परीक्षण सांख्यिकी प्राप्त करता है, परिचित प्रतिगमन t-परीक्षण के साथ संबंध स्थापित करता है 3. **व्यावहारिकता**: बहुभिन्न प्रतिगमन जैसे महत्वपूर्ण अनुप्रयोग परिदृश्य में सीधे लागू होता है ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष 1. **सैद्धांतिक योगदान**: मानक t-परीक्षण के UMPU गुण को साबित करता है, प्रतिगमन परीक्षण सिद्धांत में खाली स्थान को भरता है 2. **विधि योगदान**: GS रूपांतरण बहुसंरेखता को संभालने के लिए एक प्रभावी मार्ग प्रदान करता है, उपयुक्त परिस्थितियों में शक्ति में काफी सुधार करता है 3. **व्यावहारिक मूल्य**: नई माप $\Delta$ अनुसंधान डिजाइन और नमूना आकार गणना के लिए सैद्धांतिक आधार प्रदान करती है ### सीमाएं 1. **क्रम निर्भरता**: GS विधि की व्याख्या ऑर्थोगोनलाइजेशन क्रम पर निर्भर करती है, पूर्व ज्ञान या स्वतंत्र जांच की आवश्यकता है 2. **अनुप्रयोग शर्तें**: शक्ति वृद्धि मुख्य रूप से सकारात्मक सहसंबंधित भविष्यवाणी चर के मामले में महत्वपूर्ण है 3. **कारण धारणा**: प्रभाव आकार व्याख्या को उचित संभावित कारक मॉडल समर्थन की आवश्यकता है ### भविष्य की दिशाएं 1. **मॉडल विस्तार**: भविष्यवाणी चर के सबसेट को एक साथ कार्य करने की अनुमति देना, अधिक कारण संरचना को मैप करना 2. **क्रम चयन**: डेटा-संचालित इष्टतम ऑर्थोगोनलाइजेशन क्रम चयन विधि विकसित करना 3. **अनुप्रयोग विस्तार**: अन्य रैखिक मॉडल में अनुप्रयोग संभावना की खोज करना ## गहन मूल्यांकन ### शक्तियां 1. **सैद्धांतिक कठोरता**: परिपक्व Neyman संरचना परीक्षण सिद्धांत पर आधारित, प्रमाण प्रक्रिया पूर्ण और सख्त है 2. **व्यावहारिक मूल्य**: ठोस संख्यात्मक उदाहरण और सिमुलेशन साक्ष्य प्रदान करता है, विधि की व्यावहारिक प्रभावशीलता को दर्शाता है 3. **नवाचार**: शास्त्रीय GS अपघटन को आधुनिक सांख्यिकीय परीक्षण सिद्धांत के साथ संयोजित करता है, नई अंतर्दृष्टि उत्पन्न करता है 4. **लेखन स्पष्टता**: पेपर संरचना पूर्ण है, सिद्धांत से अनुप्रयोग तक स्तर स्पष्ट है ### कमियां 1. **धारणा सीमाएं**: सामान्यता धारणा काफी मजबूत है, वास्तविक डेटा संतुष्ट नहीं हो सकता है 2. **कम्प्यूटेशनल जटिलता**: उच्च-आयामी समस्याओं के लिए, GS अपघटन की संख्यात्मक स्थिरता समस्या हो सकती है 3. **व्याख्या चुनौती**: हालांकि आंशिक व्याख्या क्षमता बनाए रखता है, रूपांतरित गुणांक व्याख्या अभी भी सावधानीपूर्वक की जानी चाहिए ### प्रभाव 1. **सैद्धांतिक योगदान**: प्रतिगमन विश्लेषण के परीक्षण सिद्धांत के लिए महत्वपूर्ण पूरक प्रदान करता है 2. **व्यावहारिक मार्गदर्शन**: बहुसंरेखता को संभालने के लिए नए उपकरण और दृष्टिकोण प्रदान करता है 3. **अंतः-विषय अनुप्रयोग**: अर्थशास्त्र, जैव-सांख्यिकी आदि क्षेत्रों में व्यापक अनुप्रयोग संभावना है ### लागू परिदृश्य 1. **गंभीर बहुसंरेखता**: पारंपरिक विधि शक्ति अपर्याप्त होने वाले उच्च सहसंबंधित भविष्यवाणी चर परिदृश्य 2. **कारण अनुमान**: स्पष्ट चर क्रम या कारण संबंध वाले अनुसंधान 3. **शक्ति-संवेदनशील**: नैदानिक परीक्षण या नीति मूल्यांकन अनुसंधान जहां परीक्षण शक्ति के लिए उच्च आवश्यकता है ## संदर्भ 1. Bhattacharya, P. and Burman, P. (2016). सिद्धांत और सांख्यिकी की विधियां। Elsevier. 2. Hoerl, A. E. and Kennard, R. W. (1970). रिज प्रतिगमन: गैर-ऑर्थोगोनल समस्याओं के लिए पक्षपाती अनुमान। Technometrics, 12(1):55–67. 3. King, M. L. and Smith, M. D. (1986). रैखिक प्रतिगमन गुणांक के संयुक्त एकतरफा परीक्षण। Journal of Econometrics, 32(3):367–383. 4. Lehmann, E. and Romano, J. P. (2022). सांख्यिकीय परिकल्पना का परीक्षण। Springer International Publishing. --- यह पेपर सिद्धांत और विधि दोनों में महत्वपूर्ण योगदान देता है, बहुभिन्न प्रतिगमन विश्लेषण के लिए नया सैद्धांतिक आधार और व्यावहारिक उपकरण प्रदान करता है। कुछ सीमाओं के बावजूद, इसकी नवाचार और व्यावहारिक मूल्य इसे सांख्यिकी और अनुप्रयुक्त क्षेत्रों में महत्वपूर्ण कार्य बनाती है।