2025-11-19T20:13:14.047070

Regression discontinuity aggregation, with an application to the union effects on inequality

Borusyak, Kolerman-Shemer
We extend the regression discontinuity (RD) design to settings where each unit's treatment status is an average or aggregate across multiple discontinuity events. Such situations arise in many studies where the outcome is measured at a higher level of spatial or temporal aggregation (e.g., by state with district-level discontinuities) or when spillovers from discontinuity events are of interest. We propose two novel estimation procedures - one at the level at which the outcome is measured and the other in the sample of discontinuities - and show that both identify a local average causal effect under continuity assumptions similar to those of standard RD designs. We apply these ideas to study the effect of unionization on inequality in the United States. Using credible variation from close unionization elections at the establishment level, we show that a higher rate of newly unionized workers in a state-by-industry cell reduces wage inequality within the cell.
academic

Regression-Diskontinuitäts-Aggregation mit einer Anwendung auf die Auswirkungen von Gewerkschaften auf Ungleichheit

Grundinformationen

  • Papier-ID: 2501.00428
  • Titel: Regression discontinuity aggregation, with an application to the union effects on inequality
  • Autoren: Kirill Borusyak (UC Berkeley), Matan Kolerman-Shemer (The Hebrew University of Jerusalem)
  • Klassifizierung: econ.EM (Ökonometrie)
  • Veröffentlichungsdatum: Dezember 2024
  • Papierlink: https://arxiv.org/abs/2501.00428

Zusammenfassung

Dieses Papier erweitert das Regression-Diskontinuitäts-Design (RD) auf Fälle, in denen der Behandlungsstatus jeder Einheit der Durchschnitt oder Aggregation mehrerer Diskontinuitätsereignisse ist. Diese Situation tritt in vielen Studien auf, in denen Ergebnisse auf höheren räumlichen oder zeitlichen Aggregationsebenen gemessen werden (z. B. nach Bundesstaat versus regionale Diskontinuitäten), oder wenn Spillover-Effekte von Diskontinuitätsereignissen von Interesse sind. Die Autoren präsentieren zwei neue Schätzverfahren – eines auf der Ebene der gemessenen Ergebnisse und eines in der Diskontinuitätsstichprobe – und zeigen, dass beide lokale durchschnittliche Kausaleffekte unter ähnlichen Kontinuitätsannahmen wie das Standard-RD-Design identifizieren. Durch die Anwendung dieser Ideen zur Untersuchung der Auswirkungen der amerikanischen Gewerkschaftstätigkeit auf Ungleichheit, unter Verwendung glaubwürdiger Variationen von Gewerkschaftswahlen mit institutioneller Nähe, zeigen die Autoren, dass eine Erhöhung des Anteils neu gewerkschaftlich organisierter Arbeitnehmer in Bundesstaat-Industrie-Einheiten die Lohnungleichheit innerhalb der Einheit verringert.

Forschungshintergrund und Motivation

Der Kern des Problems

Das traditionelle Regression-Diskontinuitäts-Design (RD) erfordert, dass jede Einheit nur einem Diskontinuitätsereignis ausgesetzt ist. In vielen empirischen Studien ist die Ergebnisvariable jedoch auf einer höheren Aggregationsebene als die Diskontinuitätsereignisse definiert. Beispiele:

  1. Legislativstudien: Ergebnisse auf Bundesstaatsebene hängen von Wahlergebnissen in mehreren Einzelwahlkreisen ab
  2. Zeitliche Aggregation: Einheiten sind über mehrere Perioden mehreren RD-Ereignissen ausgesetzt
  3. Spillover-Effekte: Jede Einheit ist mehreren Wahlen von Nachbarn ausgesetzt

Bedeutung des Problems

Diese Einstellungen sind in der empirischen Forschung äußerst verbreitet und umfassen mehrere Bereiche wie politische Ökonomie, Arbeitsökonomie und öffentliche Finanzen. Die bestehende Literatur behandelt diese Situation normalerweise ad hoc, ohne einen einheitlichen theoretischen Rahmen und optimale Schätzmethoden.

Einschränkungen bestehender Methoden

  1. Obere Spezifikation: Enthält normalerweise nicht alle notwendigen lokalen linearen Kontrollvariablen und verliert die Verzerrungsreduktionsvorteile des RD-Designs
  2. Untere Spezifikation: Die meisten verwenden vereinfachte Formschätzungen ohne kohärentes Kausalmodell
  3. Stichprobenbeschränkung: Einige Studien beschränken die Stichprobe unnötig und verringern die statistische Aussagekraft

Kernbeiträge

  1. Theoretische Innovation: Präsentation des Regression-Diskontinuitäts-Aggregations-Rahmens (RDA), der RD-Designs auf Aggregationseinstellungen erweitert
  2. Methodologischer Beitrag: Entwicklung von zwei Schätzern – oberer IV-Schätzer und unterer gestapelter Schätzer
  3. Theoretischer Beweis: Nachweis, dass beide Schätzer unter ähnlichen Kontinuitätsannahmen denselben lokalen durchschnittlichen Behandlungseffekt identifizieren
  4. Empirische Anwendung: Anwendung der RDA-Methode zur Untersuchung der Auswirkungen der amerikanischen Gewerkschaftstätigkeit auf Ungleichheit
  5. Politische Bedeutung: Feststellung, dass Gewerkschaftstätigkeit die Lohnungleichheit innerhalb von Bundesstaat-Industrie-Einheiten erheblich verringert

Methodische Erklärung

Aufgabendefinition

Betrachten Sie N obere Einheiten i, von denen jede Ji untere Untereinheiten j enthält. Die Untereinheit j ist durch die Laufvariable rj und die Behandlung zj = 1rj ≥ 0 charakterisiert. Das Ziel ist die Schätzung des Kausalmodells:

Yi = βXi + εi

wobei Xi die obere Behandlungsvariable ist, normalerweise definiert als:

Xi = Σj∈Ji sj zj

Modellarchitektur

1. Oberer IV-Schätzer

Konstruktion von Instrumentalvariablen unter Verwendung von Untereinheiten nahe dem Cutoff:

Zi = Σj∈Ci sj zj

wobei Ci = {j ∈ Ji : |rj| ≤ h} die Menge der Untereinheiten nahe dem Cutoff ist.

Die Schlüsselinnovation ist die Aggregation von RDA-Kontrollvariablen:

Qi = (Σj∈Ci sj, Σj∈Ci sj rj, Σj∈Ci sj r+j)'

Schätzspezifikation:

Yi = βXi + γ0 Σj∈Ci sj + γ1 Σj∈Ci sj rj + γ2 Σj∈Ci sj r+j + γ̃'W̃i + Fehler i

2. Unterer gestapelter Schätzer

Schätzung der unscharfen RD-Spezifikation in der Stichprobe der Wahlen nahe dem Cutoff:

Yi(j) = βXi(j) + γ̃'W̃i(j) + λ'qj + Fehler j

wobei Xi(j) durch zj instrumentalisiert wird, qj = (1, rj, r+j) sind Standard-RD-Kontrollvariablen.

Technische Innovationspunkte

1. Theoretische Äquivalenz

Proposition 1 beweist die numerische Äquivalenz der oberen und unteren Schätzer: Der obere IV-Schätzer entspricht einem spezifischen unscharfen RD-Schätzer auf Untereinheitsebene.

2. Identifikationsergebnisse

Proposition 2 zeigt, dass beide Schätzer unter Standard-Kontinuitätsannahmen denselben lokalen durchschnittlichen Behandlungseffekt identifizieren:

β0 = E[sj · (Yi(j)(Xi(j)(1, zi(j)−j)) − Yi(j)(Xi(j)(0, zi(j)−j))) | rj = 0] / 
     E[sj · (Xi(j)(1, zi(j)−j) − Xi(j)(0, zi(j)−j)) | rj = 0]

3. Verzerrungsreduktionseigenschaften

Monte-Carlo-Simulationen zeigen, dass der Schätzer mit aggregierten lokalen linearen Kontrollvariablen die Verzerrungsreduktionseigenschaften traditioneller RD-Methoden erbt.

Experimentelle Einrichtung

Datensätze

  1. Gewerkschaftswahldaten: Institutionelle Gewerkschaftswahldaten der NLRB von 1961-2009
  2. Arbeitsmarktergebnisse: Basierend auf Zensusproben von 1960-2010 alle zehn Jahre
  3. Ergänzungsdaten: Gewerkschaftsdichte und Leistungsdaten aus der Current Population Survey (CPS)

Behandlungsvariablen und Instrumentalvariablen

  • Behandlungsvariable: NewUnionssit, Anteil neu gewerkschaftlich organisierter Arbeitnehmer in der Bundesstaat-Industrie-Einheit
  • Instrumentalvariable: Zsit, Anteil der Arbeitnehmer, die durch nahe Wahlen (Abstimmungsanteil 50±10%) gewerkschaftlich organisiert wurden
  • RDA-Kontrollvariablen: Anteil der Arbeitnehmer in nahen Wahlen, durchschnittliche Abstimmungsdifferenz usw.

Bewertungsmetriken

Fünf Ungleichheitsindikatoren:

  1. Logarithmus der Universitätsgehaltsprämie
  2. Logarithmus des 90-10-Lohnverhältnisses
  3. Gini-Koeffizient
  4. Einkommensanteil der Top 10%
  5. Logarithmische Lohnvarianz

Experimentelle Ergebnisse

Hauptergebnisse

Ungleichheitsauswirkungen

Für jeden Anstieg der neuen Gewerkschaftsquote um 1 Prozentpunkt:

  • Gini-Koeffizient sinkt um 0,018 (oberer Schätzer) / 0,013 (unterer Schätzer)
  • 90-10-Verhältnis sinkt um 0,46 / 0,27 Logarithmuspunkte
  • Top-10%-Anteil sinkt um 0,14 / 0,12 Prozentpunkte
  • Logarithmische Lohnvarianz sinkt um 0,025 / 0,021

Lohnverteilungseffekte

Gewerkschaftstätigkeit reduziert Ungleichheit hauptsächlich durch Senkung der Löhne von Hochverdienern statt durch Erhöhung der Löhne von Niedrigverdienern:

  • Durchschnittlicher Lohnrückgang von 0,35 Logarithmuspunkten
  • Signifikanter Rückgang der Managerlöhne um 0,92 Logarithmuspunkte
  • Leichter, aber nicht signifikanter Anstieg des Lohns im 10. Perzentil

Leistungsmechanismen

Gewerkschaftstätigkeit erhöht die Rentnerversicherungsabdeckung erheblich: Jedes neue Gewerkschaftsmitglied entspricht einem Anstieg von 1,48 Rentnerversicherungsinhabern, was auf erhebliche Spillover-Effekte zwischen Institutionen hindeutet.

Historische Beitragsanalyse

Die kontrafaktische Analyse zeigt, dass bei Beibehaltung der neuen Gewerkschaftsquote auf dem Niveau der 1960er Jahre:

  • Gini-Koeffizient: Gewerkschaftsrückgang erklärt 34,5% des Anstiegs von 1970-2010
  • 90-10-Verhältnis: Erklärt 33,7% des Anstiegs
  • Top-10%-Anteil: Erklärt 38,3% des Anstiegs
  • Universitätsprämie: Erklärt 60,5% des Anstiegs

Robustheitsprüfungen

Ergebnisse bleiben unter verschiedenen Spezifikationen robust:

  • Unterschiedliche Bandbreitenwahl (10% und 15%)
  • Ausschluss von Gewerkschaftsauflösungswahlen
  • Unterschiedliche Fixeffekt-Einstellungen
  • Gewichtete und ungewichtete Schätzungen

Verwandte Arbeiten

RD-Literatur

Dieses Papier erweitert das Standard-RD-Design und unterscheidet sich von Multi-Score-RD-Designs dadurch, dass Multi-Score-RD mehrere Laufvariablen an einer einzelnen Grenze behandelt, während RDA aggregierte RD-Schocks behandelt.

Shift-Share-Literatur

Die theoretische Analyse basiert auf der Shift-Share-Instrumentalvariablen-Literatur, besonders auf den Ergebnissen der numerischen Äquivalenz von Borusyak et al. (2022).

Gewerkschaften- und Ungleichheitsliteratur

Bietet eine neue Strategie zur Kausalidentifikation für die Auswirkungen von Gewerkschaften auf Ungleichheit und ergänzt Forschungen wie Farber et al. (2021), die auf beobachtbarer Selektivität basieren.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Methodologie: Der RDA-Rahmen bietet eine einheitliche theoretische Grundlage und optimale Schätzmethoden für die Behandlung aggregierter RD-Einstellungen
  2. Empirische Ergebnisse: Gewerkschaftstätigkeit verringert die Lohnungleichheit erheblich, hauptsächlich durch Kompression der Lohnverteilung am oberen Ende
  3. Politische Bedeutung: Der Gewerkschaftsrückgang ist ein wichtiger Faktor für den Anstieg der Ungleichheit in den USA

Einschränkungen

  1. Extrapolierbarkeit: Basierend auf lokalen Veränderungen nahe Wahlen zur Extrapolation auf langfristige Effekte
  2. Aggregationsebene: Berücksichtigt nur Ungleichheit innerhalb von Bundesstaat-Industrie-Einheiten, nicht zwischen Einheiten
  3. Mechanismusidentifikation: Spezifische Mechanismen, durch die Gewerkschaften Ungleichheit beeinflussen, erfordern weitere Forschung

Zukünftige Richtungen

  1. Erweiterung auf andere Aggregationseinstellungen und Spillover-Effekt-Studien
  2. Entwicklung von Methoden zur Behandlung endogener Aggregationsstrukturen
  3. Erforschung theoretischer Eigenschaften dynamischer RD-Aggregation

Tiefgreifende Bewertung

Stärken

  1. Theoretischer Beitrag: Füllt eine Lücke in der RD-Literatur bei Aggregationseinstellungen und bietet eine strenge theoretische Grundlage
  2. Methodische Innovation: Die beiden Schätzer sind clever konzipiert und erben die guten Eigenschaften traditioneller RD
  3. Empirischer Wert: Bietet neue Kausalbeweise für wichtige Politikfragen
  4. Hohe Praktikabilität: Die Methode ist auf ein breites Spektrum wirtschaftswissenschaftlicher Forschung anwendbar

Mängel

  1. Komplexität: Im Vergleich zu Standard-RD ist die RDA-Methode komplexer umzusetzen
  2. Annahmebedingungen: Erfordert stärkere Kontinuitätsannahmen zur Behandlung mehrerer Laufvariablen
  3. Rechenlast: Besonders der untere Schätzer muss mit vielen wiederholten Beobachtungen umgehen

Auswirkungen

  1. Akademischer Beitrag: Leistet wichtige Beiträge zur ökonometrischen Methodologie
  2. Politische Relevanz: Bietet neue Werkzeuge für Arbeitsmarktpolitik und Ungleichheitsforschung
  3. Reproduzierbarkeit: Bietet detaillierte Implementierungsrichtlinien und Code

Anwendungsszenarien

  1. Legislativstudien in der politischen Ökonomie
  2. Schuldenanleihen-Studien in der Bildungsökonomie
  3. Spillover-Effekt-Studien in der Arbeitsökonomie
  4. Jede wirtschaftswissenschaftliche Forschung mit aggregierten RD-Einstellungen

Literaturverzeichnis

Dieses Papier zitiert wichtige Literatur aus Ökonometrie, Arbeitsökonomie und politischer Ökonomie, besonders:

  • Borusyak et al. (2022) zur Shift-Share-Instrumentalvariablen-Forschung
  • Frandsen (2021) zur RD-Design-Forschung bei Gewerkschaftswahlen
  • Farber et al. (2021) zur Forschung über Gewerkschaften und Ungleichheit

Gesamtbewertung: Dies ist ein hochqualitatives ökonometrisches Methodologiepapier, das nicht nur wichtige theoretische Beiträge leistet, sondern auch den Wert der Methode durch bedeutungsvolle empirische Anwendungen demonstriert. Der RDA-Rahmen füllt eine Lücke in der Literatur und bietet für viele wirtschaftswissenschaftliche Studien eine geeignetere Identifikationsstrategie.