2025-11-19T20:13:14.047070

Regression discontinuity aggregation, with an application to the union effects on inequality

Borusyak, Kolerman-Shemer
We extend the regression discontinuity (RD) design to settings where each unit's treatment status is an average or aggregate across multiple discontinuity events. Such situations arise in many studies where the outcome is measured at a higher level of spatial or temporal aggregation (e.g., by state with district-level discontinuities) or when spillovers from discontinuity events are of interest. We propose two novel estimation procedures - one at the level at which the outcome is measured and the other in the sample of discontinuities - and show that both identify a local average causal effect under continuity assumptions similar to those of standard RD designs. We apply these ideas to study the effect of unionization on inequality in the United States. Using credible variation from close unionization elections at the establishment level, we show that a higher rate of newly unionized workers in a state-by-industry cell reduces wage inequality within the cell.
academic

Aggregazione della regressione discontinua, con un'applicazione agli effetti dei sindacati sulla disuguaglianza

Informazioni di Base

  • ID Articolo: 2501.00428
  • Titolo: Regression discontinuity aggregation, with an application to the union effects on inequality
  • Autori: Kirill Borusyak (UC Berkeley), Matan Kolerman-Shemer (The Hebrew University of Jerusalem)
  • Classificazione: econ.EM (Econometria)
  • Data di Pubblicazione: Dicembre 2024
  • Link Articolo: https://arxiv.org/abs/2501.00428

Riassunto

Il presente articolo estende il disegno della regressione discontinua (RD) ai casi in cui lo stato del trattamento per ogni unità è la media o l'aggregazione di molteplici eventi di discontinuità. Questa situazione si presenta in numerosi studi dove i risultati sono misurati a livelli di aggregazione spaziale o temporale superiori (ad esempio, discontinuità a livello statale versus regionale), oppure quando gli effetti di spillover degli eventi di discontinuità suscitano preoccupazione. Gli autori propongono due nuove procedure di stima—una al livello di misurazione dei risultati e un'altra nel campione di discontinuità—e dimostrano che entrambe identificano l'effetto causale medio locale secondo assunzioni di continuità simili al disegno RD standard. Applicando queste idee allo studio dell'impatto della sindacalizzazione statunitense sulla disuguaglianza, utilizzando variazioni credibili della sindacalizzazione da elezioni sindacali prossime a livello istituzionale, gli autori dimostrano che l'aumento della proporzione di lavoratori sindacalizzati di recente nelle unità stato-industria riduce la disuguaglianza salariale all'interno dell'unità.

Contesto di Ricerca e Motivazione

Il Nucleo del Problema

Il disegno della regressione discontinua tradizionale (RD) richiede che ogni unità sia esposta a un solo evento di discontinuità. Tuttavia, in molti studi empirici, la variabile di risultato è definita a livelli di aggregazione superiori rispetto agli eventi di discontinuità. Ad esempio:

  1. Studi Legislativi: i risultati a livello statale dipendono dai risultati elettorali di molteplici circoscrizioni uninominali
  2. Aggregazione Temporale: le unità sono esposte a molteplici eventi RD in più periodi
  3. Effetti di Spillover: ogni unità è esposta a molteplici elezioni dei vicini

L'Importanza del Problema

Questi tipi di impostazioni sono estremamente comuni nella ricerca empirica, coprendo molteplici campi quali l'economia politica, l'economia del lavoro e le finanze pubbliche. La letteratura esistente generalmente adotta approcci ad hoc per affrontare questa situazione, mancando di un quadro teorico unificato e di metodi di stima ottimali.

Limitazioni dei Metodi Esistenti

  1. Specificazione di Livello Superiore: generalmente non include tutte le variabili di controllo della linearità locale necessarie, perdendo i vantaggi della riduzione della distorsione del disegno RD
  2. Specificazione di Livello Inferiore: la maggior parte utilizza stime in forma ridotta, senza definire un modello causale coerente
  3. Restrizioni Campionarie: alcuni studi limitano inutilmente il campione, riducendo la potenza statistica

Contributi Fondamentali

  1. Innovazione Teorica: propone il quadro di aggregazione della regressione discontinua (RDA), estendendo il disegno RD a impostazioni aggregate
  2. Contributi Metodologici: sviluppa due stimatori—lo stimatore IV di livello superiore e lo stimatore stacked di livello inferiore
  3. Prove Teoriche: dimostra che entrambi gli stimatori identificano lo stesso effetto causale medio locale secondo assunzioni di continuità simili
  4. Applicazione Empirica: applica il metodo RDA allo studio dell'impatto della sindacalizzazione statunitense sulla disuguaglianza
  5. Significato Politico: scopre che la sindacalizzazione riduce significativamente la disuguaglianza salariale all'interno delle unità stato-industria

Dettagli Metodologici

Definizione del Compito

Si considerino N unità di livello superiore i, ciascuna contenente Ji sottounità di livello inferiore j. La sottounità j è caratterizzata da una variabile di esecuzione rj e dal trattamento zj = 1rj ≥ 0. L'obiettivo è stimare il modello causale:

Yi = βXi + εi

dove Xi è la variabile di trattamento di livello superiore, generalmente definita come:

Xi = Σj∈Ji sj zj

Architettura del Modello

1. Stimatore IV di Livello Superiore

Costruisce variabili strumentali utilizzando sottounità prossime al punto di discontinuità:

Zi = Σj∈Ci sj zj

dove Ci = {j ∈ Ji : |rj| ≤ h} è l'insieme di sottounità prossime al punto di discontinuità.

L'innovazione chiave è l'aggregazione delle variabili di controllo RDA:

Qi = (Σj∈Ci sj, Σj∈Ci sj rj, Σj∈Ci sj r+j)'

Specificazione di stima:

Yi = βXi + γ0 Σj∈Ci sj + γ1 Σj∈Ci sj rj + γ2 Σj∈Ci sj r+j + γ̃'W̃i + errori

2. Stimatore Stacked di Livello Inferiore

Stima la specificazione RD fuzzy nel campione di elezioni prossime al punto di discontinuità:

Yi(j) = βXi(j) + γ̃'W̃i(j) + λ'qj + errorj

dove Xi(j) è strumentalizzato da zj, e qj = (1, rj, r+j) sono le variabili di controllo RD standard.

Punti di Innovazione Tecnica

1. Equivalenza Teorica

La Proposizione 1 dimostra l'equivalenza numerica tra gli stimatori di livello superiore e inferiore: lo stimatore IV di livello superiore è uguale a uno specifico stimatore RD fuzzy a livello di sottounità.

2. Risultati di Identificazione

La Proposizione 2 mostra che, secondo le assunzioni di continuità standard, entrambi gli stimatori identificano lo stesso effetto causale medio locale:

β0 = E[sj · (Yi(j)(Xi(j)(1, zi(j)−j)) − Yi(j)(Xi(j)(0, zi(j)−j))) | rj = 0] / 
     E[sj · (Xi(j)(1, zi(j)−j) − Xi(j)(0, zi(j)−j)) | rj = 0]

3. Proprietà di Riduzione della Distorsione

Le simulazioni Monte Carlo mostrano che lo stimatore che include variabili di controllo di linearità locale aggregate eredita le proprietà di riduzione della distorsione dei metodi RD tradizionali.

Impostazione Sperimentale

Set di Dati

  1. Dati su Elezioni Sindacali: dati a livello istituzionale su elezioni sindacali 1961-2009 dal NLRB
  2. Risultati del Mercato del Lavoro: basati su campioni decennali di censimento 1960-2010
  3. Dati Supplementari: densità sindacale e dati sui benefici dalla Current Population Survey (CPS)

Variabili di Trattamento e Strumentali

  • Variabile di Trattamento: NewUnionssit, proporzione di lavoratori sindacalizzati di recente nell'unità stato-industria
  • Variabile Strumentale: Zsit, proporzione di lavoratori sindacalizzati attraverso elezioni prossime (quota di voti 50±10%)
  • Variabili di Controllo RDA: coinvolgono la proporzione di lavoratori in elezioni prossime, differenza media di voti, ecc.

Metriche di Valutazione

Cinque indicatori di disuguaglianza:

  1. Logaritmo del premio salariale universitario
  2. Logaritmo del rapporto salariale 90-10
  3. Coefficiente di Gini
  4. Quota di reddito del primo 10%
  5. Varianza del logaritmo dei salari

Risultati Sperimentali

Risultati Principali

Impatti sulla Disuguaglianza

Per ogni aumento di 1 punto percentuale nel tasso di sindacalizzazione di recente:

  • Coefficiente di Gini ridotto di 0,018 (stimatore di livello superiore) / 0,013 (stimatore di livello inferiore)
  • Rapporto 90-10 ridotto di 0,46 / 0,27 punti logaritmici
  • Quota del primo 10% ridotta di 0,14 / 0,12 punti percentuali
  • Varianza del logaritmo dei salari ridotta di 0,025 / 0,021

Effetti sulla Distribuzione dei Salari

La sindacalizzazione riduce principalmente la disuguaglianza abbassando i salari dei percettori di reddito elevato piuttosto che aumentando i salari dei percettori di reddito basso:

  • Salario medio ridotto di 0,35 punti logaritmici
  • Salario dei dirigenti significativamente ridotto di 0,92 punti logaritmici
  • Salario al 10° percentile leggermente aumentato ma non significativo

Meccanismi di Benefici

La sindacalizzazione aumenta significativamente la copertura pensionistica: ogni nuovo membro sindacale corrisponde a un aumento di 1,48 titolari di pensione, indicando significativi effetti di spillover tra istituzioni.

Analisi dei Contributi Storici

L'analisi controffattuale mostra che, se il tasso di sindacalizzazione di recente fosse rimasto ai livelli degli anni '60:

  • Coefficiente di Gini: il declino sindacale spiega il 34,5% della crescita 1970-2010
  • Rapporto 90-10: spiega il 33,7% della crescita
  • Quota del primo 10%: spiega il 38,3% della crescita
  • Premio universitario: spiega il 60,5% della crescita

Test di Robustezza

I risultati rimangono robusti in molteplici specificazioni:

  • Diverse scelte di larghezza di banda (10% e 15%)
  • Esclusione di elezioni di decertificazione sindacale
  • Diverse specificazioni di effetti fissi
  • Stime ponderate e non ponderate

Lavori Correlati

Letteratura RD

Il presente articolo estende il disegno RD standard, distinguendosi dai disegni RD multivariati in quanto questi ultimi affrontano molteplici variabili di esecuzione su un singolo confine, mentre RDA affronta impatti RD aggregati.

Letteratura Shift-Share

L'analisi teorica si basa sulla letteratura delle variabili strumentali shift-share, in particolare sui risultati di equivalenza numerica di Borusyak et al. (2022).

Letteratura su Sindacati e Disuguaglianza

Fornisce una nuova strategia di identificazione causale per l'impatto dei sindacati sulla disuguaglianza, complementando ricerche come quella di Farber et al. (2021) basate sull'osservabilità della selezione.

Conclusioni e Discussione

Conclusioni Principali

  1. Metodologia: il quadro RDA fornisce una base teorica unificata e metodi di stima ottimali per affrontare impostazioni RD aggregate
  2. Risultati Empirici: la sindacalizzazione riduce significativamente la disuguaglianza salariale, principalmente attraverso la compressione della distribuzione salariale superiore
  3. Significato Politico: il declino sindacale è un fattore importante nell'aumento della disuguaglianza negli Stati Uniti

Limitazioni

  1. Esternalità: basato su variazioni locali di elezioni prossime estrapolate a effetti a lungo termine
  2. Livello di Aggregazione: considera solo la disuguaglianza all'interno delle unità stato-industria, non copre la disuguaglianza tra unità
  3. Identificazione dei Meccanismi: i meccanismi specifici attraverso cui i sindacati influenzano la disuguaglianza richiedono ulteriori ricerche

Direzioni Future

  1. Estensione ad altre impostazioni aggregate e studi di effetti di spillover
  2. Sviluppo di metodi per affrontare strutture di aggregazione endogena del trattamento
  3. Esplorazione delle proprietà teoriche della RD dinamica aggregata

Valutazione Approfondita

Punti di Forza

  1. Contributo Teorico: colma il vuoto nella letteratura RD per impostazioni aggregate, fornendo una base teorica rigorosa
  2. Innovazione Metodologica: il design dei due stimatori è ingegnoso, ereditando le proprietà favorevoli della RD tradizionale
  3. Valore Empirico: fornisce nuove prove causali per importanti questioni politiche
  4. Forte Praticità: il metodo è applicabile a un'ampia gamma di ricerche economiche

Carenze

  1. Complessità: rispetto alla RD standard, il metodo RDA è più complesso da implementare
  2. Condizioni di Assunzione: richiede assunzioni di continuità più forti per affrontare molteplici variabili di esecuzione
  3. Onere Computazionale: in particolare lo stimatore di livello inferiore richiede l'elaborazione di numerose osservazioni ripetute

Impatto

  1. Contributo Accademico: fornisce un importante contributo alla metodologia econometrica
  2. Rilevanza Politica: fornisce nuovi strumenti per la ricerca sulla politica del lavoro e la disuguaglianza
  3. Riproducibilità: fornisce linee guida di implementazione dettagliate e codice

Scenari Applicabili

  1. Studi legislativi nell'economia politica
  2. Studi su obbligazioni scolastiche nell'economia dell'istruzione
  3. Studi su effetti di spillover nell'economia del lavoro
  4. Qualsiasi ricerca economica che coinvolga impostazioni RD aggregate

Bibliografia

Il presente articolo cita importanti letterature in econometria, economia del lavoro ed economia politica, in particolare:

  • Borusyak et al. (2022) sulla ricerca delle variabili strumentali shift-share
  • Frandsen (2021) sul disegno RD per elezioni sindacali
  • Farber et al. (2021) sulla ricerca di sindacati e disuguaglianza

Valutazione Complessiva: questo è un articolo di alta qualità sulla metodologia econometrica che non solo fornisce importanti contributi teorici, ma dimostra anche il valore del metodo attraverso un'applicazione empirica significativa. Il quadro RDA colma un vuoto nella letteratura, fornendo una strategia di identificazione più appropriata per molte ricerche economiche.