Inference on effect size after multiple hypothesis testing
Dzemski, Okui, Wang
Significant treatment effects are often emphasized when interpreting and summarizing empirical findings in studies that estimate multiple, possibly many, treatment effects. Under this kind of selective reporting, conventional treatment effect estimates may be biased and their corresponding confidence intervals may undercover the true effect sizes. We propose new estimators and confidence intervals that provide valid inferences on the effect sizes of the significant effects after multiple hypothesis testing. Our methods are based on the principle of selective conditional inference and complement a wide range of tests, including step-up tests and bootstrap-based step-down tests. Our approach is scalable, allowing us to study an application with over 370 estimated effects. We justify our procedure for asymptotically normal treatment effect estimators. We provide two empirical examples that demonstrate bias correction and confidence interval adjustments for significant effects. The magnitude and direction of the bias correction depend on the correlation structure of the estimated effects and whether the interpretation of the significant effects depends on the (in)significance of other effects.
academic
बहुविध परिकल्पना परीक्षण के बाद प्रभाव आकार पर अनुमान
बहुविध उपचार प्रभावों के अनुमान वाले अध्ययनों में, सांख्यिकीय रूप से महत्वपूर्ण उपचार प्रभाव अक्सर अनुभवजन्य निष्कर्षों की व्याख्या और सारांश में जोर दिए जाते हैं। इस चयनात्मक रिपोर्टिंग के तहत, पारंपरिक उपचार प्रभाव अनुमान पूर्वाग्रहपूर्ण हो सकते हैं, और उनके संबंधित विश्वास अंतराल वास्तविक प्रभाव आकार को पर्याप्त रूप से कवर नहीं कर सकते हैं। यह पेपर नए अनुमानक और विश्वास अंतराल प्रस्तावित करता है जो बहुविध परिकल्पना परीक्षण के बाद महत्वपूर्ण प्रभावों के प्रभाव आकार के लिए प्रभावी अनुमान प्रदान करते हैं। विधि चयनात्मक सशर्त अनुमान सिद्धांत पर आधारित है, जो step-up परीक्षणों और bootstrap-आधारित step-down परीक्षणों सहित परीक्षण विधियों की एक विस्तृत श्रृंखला पर लागू होती है। यह विधि स्केलेबल है और 370 से अधिक अनुमानित प्रभावों वाले अनुप्रयोगों का अध्ययन कर सकती है। लेखक渐近सामान्य उपचार प्रभाव अनुमानकों के लिए प्रक्रिया की वैधता साबित करते हैं और महत्वपूर्ण प्रभावों के पूर्वाग्रह सुधार और विश्वास अंतराल समायोजन को प्रदर्शित करने के लिए दो अनुभवजन्य उदाहरण प्रदान करते हैं।
अर्थशास्त्र, चिकित्सा, मनोविज्ञान और अन्य क्षेत्रों के अनुभवजन्य अनुसंधान में, शोधकर्ताओं को अक्सर कई उपचार प्रभावों का अनुमान लगाने की आवश्यकता होती है। ये प्रभाव विभिन्न परिणाम चर, हस्तक्षेप प्रकार या जनसंख्या उप-समूहों से आ सकते हैं। बहुविध परिकल्पना परीक्षण प्रक्रिया के माध्यम से, शोधकर्ता इन प्रभावों को सांख्यिकीय रूप से महत्वपूर्ण या गैर-महत्वपूर्ण के रूप में वर्गीकृत करते हैं, फिर महत्वपूर्ण प्रभावों की व्यावहारिक महत्ता पर ध्यान केंद्रित करते हैं।
जब शोधकर्ता अपना ध्यान महत्वपूर्ण प्रभावों तक सीमित करते हैं, तो इन प्रभावों के अनुमान परिमाण चयन पूर्वाग्रह से प्रभावित होते हैं, जो पारंपरिक सांख्यिकीय अनुमान विधियों को अमान्य करता है। विशेष रूप से:
चयन पूर्वाग्रह: महत्वपूर्ण प्रभाव अक्सर सकारात्मक रूप से चयनित होते हैं ("विजेता का श्राप"), उनका परिमाण अधिक अनुमानित होता है
अपर्याप्त विश्वास अंतराल कवरेज: पारंपरिक विश्वास अंतराल प्रभावी सांख्यिकीय कवरेज प्रदान नहीं कर सकते
पूर्वाग्रह सुधार की कमी: मौजूदा विधियों में चयन के बाद प्रभाव आकार के लिए निष्पक्ष अनुमान की कमी है
पेपर मानता है कि चयनात्मक सारांश और व्याख्या से बचना समस्या को हल नहीं करता है, बल्कि केवल समग्र परिणामों के बोझ को पाठकों को स्थानांतरित करता है, जो अभी भी चयनात्मक अनुमान समस्या का सामना करते हैं। इसलिए, बहुविध परिकल्पना परीक्षण के बाद अनुमान समस्याओं को संभालने के लिए विशेष सांख्यिकीय विधियों को विकसित करने की आवश्यकता है।
चयनात्मक सशर्त अनुमान पर आधारित नई विधि प्रस्तावित की: बहुविध परिकल्पना परीक्षण के बाद महत्वपूर्ण प्रभावों के प्रभाव आकार के लिए प्रभावी बिंदु अनुमान और विश्वास अंतराल प्रदान करता है
कुशल कम्प्यूटेशनल एल्गोरिदम विकसित किए: O(m³logm) समय जटिलता वाला एल्गोरिदम प्रस्तावित किया, जो विधि को सैकड़ों प्रभावों के अनुप्रयोगों तक विस्तारित करने में सक्षम बनाता है
स्पर्शोन्मुख सिद्धांत स्थापित किया: स्पर्शोन्मुख सामान्य उपचार प्रभाव अनुमानकों के तहत प्रक्रिया की सुसंगत स्पर्शोन्मुख दक्षता साबित की
व्यापक प्रयोज्यता प्रदान की: विधि कई बहुविध परीक्षण प्रक्रियाओं पर लागू होती है, जिसमें step-down और step-up परीक्षण शामिल हैं
व्यावहारिक अनुप्रयोग मूल्य प्रदर्शित किया: दो अनुभवजन्य अनुप्रयोगों के माध्यम से विधि की प्रभावशीलता और व्यावहारिकता सत्यापित की
m उपचार प्रभाव पैरामीटर θ = (θ₁, ..., θₘ)' और उनके अनुमानक θ̂ दिए गए हैं, बहुविध परिकल्पना परीक्षण के माध्यम से महत्वपूर्ण प्रभाव सेट Ŝ निर्धारित करने के बाद, महत्वपूर्ण प्रभावों के वास्तविक प्रभाव आकार पर निष्पक्ष अनुमान प्रदान करना।
पारंपरिक विधियों को जटिल चयन घटना X(S) की सीधी गणना की आवश्यकता होती है, यह पेपर निम्नलिखित नवाचार के माध्यम से इससे बचता है:
एल्गोरिदम 2: सशर्त समर्थन की गणना
(A) रैखिक फलन xz,h(xs) के सभी प्रतिच्छेदन बिंदुओं को खोजकर अंतराल I खोजें
(B) प्रत्येक अंतराल I के लिए:
i. क्रमबद्ध क्रमचय σ*I खोजें
ii. अंतराल सीमाएं ℓ(I) और u(I) की गणना करें
(C) ∪I I ∩ [ℓ(I), u(I)] लौटाएं
प्रतिक्रिया दर और मिलान के साथ दान की राशि तीनों प्रक्रियाओं के तहत महत्वपूर्ण हैं
पूर्वाग्रह सुधार की दिशा और परिमाण सहसंबंध संरचना पर निर्भर करता है
"मिलान के साथ दान की राशि" के लिए, Holm और Bonferroni परीक्षणों के तहत ऊपर की ओर सुधार होता है, जो अत्यधिक सहसंबद्ध "मिलान के बिना दान की राशि" के गैर-महत्वपूर्ण होने से संबंधित है
प्रमेय 4 सशर्त विश्वास अंतराल के बिना शर्त विश्वास अंतराल में अभिसरण के लिए पर्याप्त शर्तें देता है, जब प्रभाव "अत्यधिक महत्वपूर्ण" हों तो दोनों विधियां एक समान हो जाती हैं।
विधि प्रभावशीलता: प्रस्तावित सशर्त अनुमान विधि सीमित नमूने में अच्छा प्रदर्शन करती है, यहां तक कि गैर-गाऊसी सेटिंग में भी चयन पूर्वाग्रह को पकड़ सकती है
कम्प्यूटेशनल व्यावहारिकता: एल्गोरिदम की बहुपद समय जटिलता विधि को सैकड़ों प्रभावों को संभालने में सक्षम बनाती है
व्यावहारिक मूल्य: दो अनुभवजन्य अनुप्रयोग दिखाते हैं कि पूर्वाग्रह सुधार की दिशा और परिमाण की भविष्यवाणी करना कठिन है, जो औपचारिक सांख्यिकीय विधि की प्रासंगिकता को उजागर करता है
पूर्व-निर्दिष्ट परिकल्पना धारणा: विधि मानती है कि परीक्षण की जाने वाली परिकल्पनाओं का पूरा सेट ज्ञात है, गैर-महत्वपूर्ण परिणामों को छिपाने की स्थिति को संभाल नहीं सकती
कम्प्यूटेशनल जटिलता: हालांकि बहुपद समय है, लेकिन बहुत बड़े m के लिए अभी भी कम्प्यूटेशनल चुनौतियों का सामना कर सकता है
मॉडल धारणाएं: स्पर्शोन्मुख सामान्यता और सुसंगत अनुमानित सहप्रसरण मैट्रिक्स की आवश्यकता है
पेपर चयनात्मक अनुमान क्षेत्र के मुख्य साहित्य को उद्धृत करता है, जिसमें Lee et al. (2016) की बहुफलकीय विधि, Fithian et al. (2017) के चयनात्मक सशर्त अनुमान सिद्धांत, और Romano and Wolf (2005) की बहुविध परीक्षण प्रक्रियाएं शामिल हैं। ये उद्धरण इस क्षेत्र में पेपर की गहराई और व्यापकता को प्रदर्शित करते हैं।