Partial Identification of Individual-Level Parameters Using Aggregate Data in a Nonparametric Model
Moon
I develop a methodology to partially identify linear combinations of conditional mean outcomes when the researcher only has access to aggregate data. Unlike the existing literature, I only allow for marginal, not joint, distributions of covariates in my model of aggregate data. Bounds are obtained by solving an optimization program and can easily accommodate additional polyhedral shape restrictions. I provide an empirical illustration of the method to Rhode Island standardized exam data.
academic
التعريف الجزئي للمعاملات على المستوى الفردي باستخدام البيانات الإجمالية في نموذج غير معياري
تطور هذه الورقة منهجية للتعريف الجزئي بالتوليفات الخطية لنتائج المتوسط الشرطي عندما يتمكن الباحثون من الحصول على بيانات إجمالية فقط. بخلاف الأدبيات الموجودة، يسمح المؤلف فقط بالتوزيع الهامشي للمتغيرات المستقلة وليس التوزيع المشترك في نموذج البيانات الإجمالية. يتم الحصول على الحدود من خلال حل برنامج تحسين ويمكن بسهولة استيعاب قيود إضافية على شكل متعدد الأوجه. تقدم الورقة تطبيقاً تجريبياً للطريقة على بيانات الاختبارات الموحدة في رود آيلاند.
يعالج هذا البحث مشكلة الاستدلال البيئي: كيفية استنتاج معاملات المستوى الفردي عندما يتمكن الباحثون من ملاحظة البيانات الإجمالية فقط. بشكل محدد، عندما يكون من الممكن ملاحظة فقط:
متوسط النتائج داخل كل مجموعة EYi|Gi = g
التوزيع الهامشي لكل متغير مستقل داخل المجموعة PXℓi = xk,ℓ|Gi = g
الحجم النسبي للمجموعات PGi = g
كيفية تعريف التوليفات الخطية للمتوسط الشرطي على المستوى الفردي EYi|Xi = xk؟
تفترض الأدبيات الموجودة (مثل Cross و Manski 2002، Cho و Manski 2008) عادة أنه يمكن ملاحظة التوزيع المشترك للمتغيرات المستقلة، وهذا غالباً ما يكون غير واقعي في الممارسة العملية. التطبيق المباشر للطرق الموجودة ينتج عنه حدود غير محكمة.
الاكتشاف الرئيسي: عندما تقترب الاحتمالات الهامشية PXℓi = xk,ℓ|Gi = g من 1، تكون الحدود أكثر ثراءً بالمعلومات. السبب هو أن نطاق القيم الممكنة للاحتمالية المشتركة PXi = xk|Gi = g يكون أصغر في هذه الحالة.
الفجوة في معدل النجاح في الرياضيات بين البيض وغير البيض:
بدون قيود: حدود واسعة جداً، معلومات قليلة تقريباً
قيود الرتابة: تضييق جزئي للحدود لبعض المعاملات
بيانات المجموعات الفرعية: تحسين كبير للحدود
بيانات المجموعات الفرعية + الرتابة: أضيق حدود، مثل الفجوة للطلاب الذين يعانون من صعوبات اقتصادية لكنهم ليسوا متعلمي لغة إنجليزية تقدر بـ -26%, 52%
نتائج اختبار اللغة الإنجليزية متشابهة، حيث تقدر فجوة معدل النجاح بين البيض وغير البيض للطلاب الذين يعانون من صعوبات اقتصادية وليسوا متعلمي لغة إنجليزية بـ -30%, 64%.
Cross, P. J. و C. F. Manski (2002). الانحدارات، القصيرة والطويلة. Econometrica 70(1)، 357–368.
Cho, W. K. T. و C. F. Manski (2008). الاستدلال على المستوى المتقاطع/البيئي. دليل أكسفورد للمنهجية السياسية.
Robinson, W. S. (1950). الارتباطات البيئية وسلوك الأفراد. المراجعة الاجتماعية الأمريكية 15(3)، 351–357.
تقدم هذه الورقة مساهمة مهمة في مجال الاستدلال البيئي، خاصة في التعامل مع قيود البيانات الفعلية. على الرغم من وجود بعض القيود الحسابية والافتراضية، فإن صرامتها النظرية وقيمتها العملية تجعلها تقدماً مهماً في هذا المجال.