2025-11-19T20:13:14.047070

Regression discontinuity aggregation, with an application to the union effects on inequality

Borusyak, Kolerman-Shemer
We extend the regression discontinuity (RD) design to settings where each unit's treatment status is an average or aggregate across multiple discontinuity events. Such situations arise in many studies where the outcome is measured at a higher level of spatial or temporal aggregation (e.g., by state with district-level discontinuities) or when spillovers from discontinuity events are of interest. We propose two novel estimation procedures - one at the level at which the outcome is measured and the other in the sample of discontinuities - and show that both identify a local average causal effect under continuity assumptions similar to those of standard RD designs. We apply these ideas to study the effect of unionization on inequality in the United States. Using credible variation from close unionization elections at the establishment level, we show that a higher rate of newly unionized workers in a state-by-industry cell reduces wage inequality within the cell.
academic

Agregación de discontinuidad de regresión, con una aplicación a los efectos de los sindicatos en la desigualdad

Información Básica

  • ID del Artículo: 2501.00428
  • Título: Regression discontinuity aggregation, with an application to the union effects on inequality
  • Autores: Kirill Borusyak (UC Berkeley), Matan Kolerman-Shemer (The Hebrew University of Jerusalem)
  • Clasificación: econ.EM (Econometría)
  • Fecha de Publicación: Diciembre 2024
  • Enlace del Artículo: https://arxiv.org/abs/2501.00428

Resumen

Este artículo extiende el diseño de discontinuidad de regresión (RD) a casos donde el estado de tratamiento de cada unidad es el promedio o agregación de múltiples eventos de discontinuidad. Esta situación surge en muchos estudios donde los resultados se miden en niveles de agregación espacial o temporal más altos (por ejemplo, discontinuidades a nivel estatal versus regional), o cuando los efectos de desbordamiento de eventos de discontinuidad son motivo de preocupación. Los autores proponen dos nuevos procedimientos de estimación —uno en el nivel donde se mide el resultado, otro en la muestra de discontinuidad— y demuestran que ambos identifican el efecto causal promedio local bajo supuestos de continuidad similares al diseño RD estándar. Mediante la aplicación de estas ideas para estudiar el impacto de la sindicalización estadounidense en la desigualdad, utilizando variación creíble de elecciones de sindicalización cercanas a nivel institucional, los autores demuestran que aumentos en la proporción de trabajadores recién sindicalizados en unidades estado-industria reducen la desigualdad salarial dentro de la unidad.

Contexto e Motivación de la Investigación

El Núcleo del Problema

El diseño de discontinuidad de regresión tradicional (RD) requiere que cada unidad esté expuesta a un único evento de discontinuidad. Sin embargo, en muchos estudios empíricos, la variable de resultado se define en un nivel de agregación más alto que los eventos de discontinuidad. Por ejemplo:

  1. Estudios Legislativos: Los resultados a nivel estatal dependen de resultados electorales en múltiples distritos uninominales
  2. Agregación Temporal: Las unidades están expuestas a múltiples eventos RD en varios períodos
  3. Efectos de Desbordamiento: Cada unidad está expuesta a múltiples elecciones de sus vecinos

Importancia del Problema

Estos tipos de configuraciones son extremadamente comunes en la investigación empírica, abarcando economía política, economía laboral, finanzas públicas y otros campos. La literatura existente típicamente utiliza enfoques ad hoc para manejar esta situación, careciendo de un marco teórico unificado y métodos de estimación óptimos.

Limitaciones de los Métodos Existentes

  1. Especificación Superior: Típicamente no incluye todas las variables de control de linealidad local necesarias, perdiendo las ventajas de reducción de sesgo del diseño RD
  2. Especificación Inferior: La mayoría utiliza estimación de forma reducida, sin definir un modelo causal coherente
  3. Restricción de Muestra: Algunos estudios limitan innecesariamente la muestra, reduciendo el poder estadístico

Contribuciones Principales

  1. Innovación Teórica: Propone el marco de agregación de discontinuidad de regresión (RDA), extendiendo el diseño RD a configuraciones agregadas
  2. Contribución Metodológica: Desarrolla dos estimadores —estimador IV de nivel superior y estimador apilado de nivel inferior
  3. Prueba Teórica: Demuestra que ambos estimadores identifican el mismo efecto causal promedio local bajo supuestos de continuidad similares
  4. Aplicación Empírica: Aplica el método RDA para estudiar el impacto de la sindicalización estadounidense en la desigualdad
  5. Significancia Política: Encuentra que la sindicalización reduce significativamente la desigualdad salarial dentro de unidades estado-industria

Detalles Metodológicos

Definición de la Tarea

Considere N unidades de nivel superior i, cada una conteniendo Ji subunidades de nivel inferior j. La subunidad j se caracteriza por una variable de ejecución rj y tratamiento zj = 1rj ≥ 0. El objetivo es estimar el modelo causal:

Yi = βXi + εi

donde Xi es la variable de tratamiento de nivel superior, típicamente definida como:

Xi = Σj∈Ji sj zj

Arquitectura del Modelo

1. Estimador IV de Nivel Superior

Construye variables instrumentales utilizando subunidades cercanas al punto de corte:

Zi = Σj∈Ci sj zj

donde Ci = {j ∈ Ji : |rj| ≤ h} es el conjunto de subunidades cercanas al punto de corte.

La innovación clave es agregar variables de control RDA:

Qi = (Σj∈Ci sj, Σj∈Ci sj rj, Σj∈Ci sj r+j)'

Especificación de estimación:

Yi = βXi + γ0 Σj∈Ci sj + γ1 Σj∈Ci sj rj + γ2 Σj∈Ci sj r+j + γ̃'W̃i + errori

2. Estimador Apilado de Nivel Inferior

Estima la especificación RD difusa en la muestra de elecciones cercanas al punto de corte:

Yi(j) = βXi(j) + γ̃'W̃i(j) + λ'qj + errorj

donde Xi(j) se instrumentaliza mediante zj, y qj = (1, rj, r+j) son variables de control RD estándar.

Puntos de Innovación Técnica

1. Equivalencia Teórica

La Proposición 1 prueba la equivalencia numérica de los estimadores de nivel superior e inferior: el estimador IV de nivel superior es igual a un estimador RD difuso específico a nivel de subunidad.

2. Resultados de Identificación

La Proposición 2 indica que, bajo supuestos de continuidad estándar, ambos estimadores identifican el mismo efecto causal promedio local:

β0 = E[sj · (Yi(j)(Xi(j)(1, zi(j)−j)) − Yi(j)(Xi(j)(0, zi(j)−j))) | rj = 0] / 
     E[sj · (Xi(j)(1, zi(j)−j) − Xi(j)(0, zi(j)−j)) | rj = 0]

3. Propiedades de Reducción de Sesgo

Las simulaciones de Monte Carlo muestran que el estimador que incluye variables de control de linealidad local agregadas hereda las propiedades de reducción de sesgo de los métodos RD tradicionales.

Configuración Experimental

Conjunto de Datos

  1. Datos de Elecciones Sindicales: Datos de elecciones sindicales a nivel institucional de 1961-2009 de la NLRB
  2. Resultados del Mercado Laboral: Basados en muestras de censo decenal de 1960-2010
  3. Datos Complementarios: Datos de densidad sindical y beneficios de la Encuesta de Población Actual (CPS)

Variables de Tratamiento e Instrumentales

  • Variable de Tratamiento: NewUnionssit, proporción de trabajadores recién sindicalizados en la unidad estado-industria
  • Variable Instrumental: Zsit, proporción de trabajadores sindicalizados mediante elecciones cercanas (margen de votación 50±10%)
  • Variables de Control RDA: Involucran proporción de trabajadores en elecciones cercanas, margen de votación promedio, etc.

Métricas de Evaluación

Cinco indicadores de desigualdad:

  1. Logaritmo de la prima salarial universitaria
  2. Logaritmo de la razón salarial 90-10
  3. Coeficiente de Gini
  4. Participación de ingresos del 10% superior
  5. Varianza de salarios logarítmicos

Resultados Experimentales

Resultados Principales

Impactos en la Desigualdad

Por cada aumento de 1 punto porcentual en la tasa de sindicalización nueva:

  • Coeficiente de Gini disminuye 0.018 (estimador superior) / 0.013 (estimador inferior)
  • Razón 90-10 disminuye 0.46 / 0.27 puntos logarítmicos
  • Participación del 10% superior disminuye 0.14 / 0.12 puntos porcentuales
  • Varianza de salarios logarítmicos disminuye 0.025 / 0.021

Efectos en la Distribución Salarial

La sindicalización reduce la desigualdad principalmente mediante la reducción de salarios de altos ingresos en lugar de aumentar salarios de bajos ingresos:

  • Salario promedio disminuye 0.35 puntos logarítmicos
  • Salarios de gerentes disminuyen significativamente 0.92 puntos logarítmicos
  • Salario del percentil 10 aumenta ligeramente pero no es significativo

Mecanismo de Beneficios

La sindicalización aumenta significativamente la cobertura de pensiones: cada nuevo miembro sindical corresponde a un aumento de 1.48 titulares de pensiones, indicando efectos de desbordamiento significativos entre instituciones.

Análisis de Contribución Histórica

El análisis contrafáctico sugiere que si la tasa de sindicalización nueva se hubiera mantenido en los niveles de los años 60:

  • Coeficiente de Gini: La decadencia sindical explica el 34.5% del crecimiento de 1970-2010
  • Razón 90-10: Explica el 33.7% del crecimiento
  • Participación del 10% superior: Explica el 38.3% del crecimiento
  • Prima universitaria: Explica el 60.5% del crecimiento

Pruebas de Robustez

Los resultados se mantienen robustos bajo múltiples especificaciones:

  • Diferentes selecciones de ancho de banda (10% y 15%)
  • Exclusión de elecciones de desindicalización
  • Diferentes especificaciones de efectos fijos
  • Estimaciones ponderadas y no ponderadas

Trabajo Relacionado

Literatura de RD

Este artículo extiende el diseño RD estándar, diferenciándose del diseño RD multifraccionado en que: el RD multifraccionado maneja múltiples variables de ejecución en un único límite, mientras que RDA maneja impactos RD agregados.

Literatura de Shift-Share

El análisis teórico se basa en la literatura de variables instrumentales shift-share, particularmente los resultados de equivalencia numérica de Borusyak et al. (2022).

Literatura de Sindicatos y Desigualdad

Proporciona una nueva estrategia de identificación causal para el impacto de los sindicatos en la desigualdad, complementando investigaciones como Farber et al. (2021) basadas en observabilidad de selección.

Conclusiones y Discusión

Conclusiones Principales

  1. Metodología: El marco RDA proporciona una base teórica unificada y métodos de estimación óptimos para manejar configuraciones RD agregadas
  2. Hallazgos Empíricos: La sindicalización reduce significativamente la desigualdad salarial, principalmente mediante la compresión de la distribución salarial en el extremo superior
  3. Significancia Política: La decadencia sindical es un factor importante en el aumento de la desigualdad estadounidense

Limitaciones

  1. Extrapolabilidad: Basada en cambios locales de elecciones cercanas, extrapolando a efectos a largo plazo
  2. Nivel de Agregación: Solo considera desigualdad dentro de unidades estado-industria, sin cubrir desigualdad entre unidades
  3. Identificación de Mecanismos: Los mecanismos específicos mediante los cuales los sindicatos afectan la desigualdad requieren investigación adicional

Direcciones Futuras

  1. Extensión a otras configuraciones agregadas e investigaciones de efectos de desbordamiento
  2. Desarrollo de métodos para manejar estructuras de agregación endógena de tratamiento
  3. Exploración de propiedades teóricas de agregación RD dinámica

Evaluación Profunda

Fortalezas

  1. Contribución Teórica: Llena un vacío en la literatura de RD en configuraciones agregadas, proporcionando una base teórica rigurosa
  2. Innovación Metodológica: El diseño de dos estimadores es ingenioso, heredando las propiedades deseables del RD tradicional
  3. Valor Empírico: Proporciona nueva evidencia causal para un importante problema de política
  4. Practicidad Fuerte: El método es aplicable a una amplia gama de investigaciones económicas

Insuficiencias

  1. Complejidad: Comparado con RD estándar, el método RDA es más complejo de implementar
  2. Condiciones de Supuestos: Requiere supuestos de continuidad más fuertes para manejar múltiples variables de ejecución
  3. Carga Computacional: Particularmente el estimador de nivel inferior requiere manejar muchas observaciones duplicadas

Impacto

  1. Contribución Académica: Realiza una contribución importante a la metodología de econometría
  2. Relevancia Política: Proporciona nuevas herramientas para investigación de política laboral y desigualdad
  3. Reproducibilidad: Proporciona orientación de implementación detallada y código

Escenarios Aplicables

  1. Estudios de legislaturas en economía política
  2. Investigación de bonos escolares en economía de la educación
  3. Investigación de efectos de desbordamiento en economía laboral
  4. Cualquier investigación económica que involucre configuraciones RD agregadas

Referencias

Este artículo cita literatura importante en econometría, economía laboral y economía política, particularmente:

  • Borusyak et al. (2022) sobre investigación de variables instrumentales shift-share
  • Frandsen (2021) sobre diseño RD de elecciones sindicales
  • Farber et al. (2021) sobre investigación de sindicatos y desigualdad

Evaluación General: Este es un artículo de alta calidad en metodología de econometría que no solo proporciona contribuciones teóricas importantes, sino que también demuestra el valor del método mediante una aplicación empírica significativa. El marco RDA llena un vacío en la literatura, proporcionando una estrategia de identificación más apropiada para muchas investigaciones económicas.