Partial Identification of Individual-Level Parameters Using Aggregate Data in a Nonparametric Model
Moon
I develop a methodology to partially identify linear combinations of conditional mean outcomes when the researcher only has access to aggregate data. Unlike the existing literature, I only allow for marginal, not joint, distributions of covariates in my model of aggregate data. Bounds are obtained by solving an optimization program and can easily accommodate additional polyhedral shape restrictions. I provide an empirical illustration of the method to Rhode Island standardized exam data.
academic
समग्र डेटा का उपयोग करके गैर-पैरामीट्रिक मॉडल में व्यक्तिगत-स्तर के पैरामीटर की आंशिक पहचान
यह पेपर एक पद्धति विकसित करता है जो तब सशर्त माध्य परिणामों के रैखिक संयोजन की आंशिक पहचान के लिए है जब शोधकर्ता केवल समग्र डेटा प्राप्त कर सकते हैं। मौजूदा साहित्य के विपरीत, लेखक समग्र डेटा मॉडल में केवल सहसंयोजकों के सीमांत वितरण की अनुमति देते हैं, संयुक्त वितरण नहीं। अनुकूलन कार्यक्रम को हल करके सीमाएं प्राप्त की जाती हैं और अतिरिक्त बहुफलकीय आकार की बाधाओं को आसानी से समायोजित किया जा सकता है। पेपर रोड आइलैंड मानकीकृत परीक्षा डेटा पर विधि के अनुभवजन्य अनुप्रयोग प्रदान करता है।
यह अनुसंधान पारिस्थितिक अनुमान समस्या को संबोधित करता है: जब शोधकर्ता केवल समग्र डेटा देख सकते हैं, तो व्यक्तिगत-स्तर के पैरामीटर का अनुमान कैसे लगाया जाए। विशेष रूप से, जब केवल निम्नलिखित को देखा जा सकता है:
प्रत्येक समूह के भीतर औसत परिणाम EYi|Gi = g
प्रत्येक समूह के भीतर प्रत्येक सहसंयोजक का सीमांत वितरण PXℓi = xk,ℓ|Gi = g
समूहों का सापेक्ष आकार PGi = g
व्यक्तिगत-स्तर की सशर्त माध्य EYi|Xi = xk के रैखिक संयोजन की पहचान कैसे करें।
मौजूदा साहित्य (जैसे Cross और Manski 2002, Cho और Manski 2008) आमतौर पर मानते हैं कि सहसंयोजकों का संयुक्त वितरण देखा जा सकता है, जो व्यावहारिक रूप से अक्सर अवास्तविक है। मौजूदा विधियों का सीधा अनुप्रयोग गैर-कसी सीमाएं उत्पन्न करता है।
मुख्य खोज: जब सीमांत संभावना PXℓi = xk,ℓ|Gi = g 1 के करीब होती है, तो सीमाएं अधिक सूचनापूर्ण होती हैं। कारण यह है कि इस स्थिति में संयुक्त संभावना PXi = xk|Gi = g के संभावित मान की सीमा छोटी होती है।
Cross, P. J. और C. F. Manski (2002). Regressions, short and long. Econometrica 70(1), 357–368.
Cho, W. K. T. और C. F. Manski (2008). Cross-level/ecological inference. The Oxford Handbook of Political Methodology.
Robinson, W. S. (1950). Ecological correlations and the behavior of individuals. American Sociological Review 15(3), 351–357.
यह पेपर पारिस्थितिक अनुमान क्षेत्र में महत्वपूर्ण योगदान देता है, विशेष रूप से वास्तविक डेटा सीमाओं को संभालने में। हालांकि कुछ कम्प्यूटेशनल और धारणा संबंधी सीमाएं हैं, लेकिन इसकी सैद्धांतिक कठोरता और व्यावहारिक मूल्य इसे इस क्षेत्र में महत्वपूर्ण प्रगति बनाते हैं।