2025-11-19T20:13:14.047070

Regression discontinuity aggregation, with an application to the union effects on inequality

Borusyak, Kolerman-Shemer

We extend the regression discontinuity (RD) design to settings where each unit's treatment status is an average or aggregate across multiple discontinuity events. Such situations arise in many studies where the outcome is measured at a higher level of spatial or temporal aggregation (e.g., by state with district-level discontinuities) or when spillovers from discontinuity events are of interest. We propose two novel estimation procedures - one at the level at which the outcome is measured and the other in the sample of discontinuities - and show that both identify a local average causal effect under continuity assumptions similar to those of standard RD designs. We apply these ideas to study the effect of unionization on inequality in the United States. Using credible variation from close unionization elections at the establishment level, we show that a higher rate of newly unionized workers in a state-by-industry cell reduces wage inequality within the cell.

academic

Regression-Diskontinuitäts-Aggregation mit einer Anwendung auf die Auswirkungen von Gewerkschaften auf Ungleichheit

Grundinformationen

Papier-ID: 2501.00428
Titel: Regression discontinuity aggregation, with an application to the union effects on inequality
Autoren: Kirill Borusyak (UC Berkeley), Matan Kolerman-Shemer (The Hebrew University of Jerusalem)
Klassifizierung: econ.EM (Ökonometrie)
Veröffentlichungsdatum: Dezember 2024
Papierlink: https://arxiv.org/abs/2501.00428

Zusammenfassung

Dieses Papier erweitert das Regression-Diskontinuitäts-Design (RD) auf Fälle, in denen der Behandlungsstatus jeder Einheit der Durchschnitt oder Aggregation mehrerer Diskontinuitätsereignisse ist. Diese Situation tritt in vielen Studien auf, in denen Ergebnisse auf höheren räumlichen oder zeitlichen Aggregationsebenen gemessen werden (z. B. nach Bundesstaat versus regionale Diskontinuitäten), oder wenn Spillover-Effekte von Diskontinuitätsereignissen von Interesse sind. Die Autoren präsentieren zwei neue Schätzverfahren – eines auf der Ebene der gemessenen Ergebnisse und eines in der Diskontinuitätsstichprobe – und zeigen, dass beide lokale durchschnittliche Kausaleffekte unter ähnlichen Kontinuitätsannahmen wie das Standard-RD-Design identifizieren. Durch die Anwendung dieser Ideen zur Untersuchung der Auswirkungen der amerikanischen Gewerkschaftstätigkeit auf Ungleichheit, unter Verwendung glaubwürdiger Variationen von Gewerkschaftswahlen mit institutioneller Nähe, zeigen die Autoren, dass eine Erhöhung des Anteils neu gewerkschaftlich organisierter Arbeitnehmer in Bundesstaat-Industrie-Einheiten die Lohnungleichheit innerhalb der Einheit verringert.

Forschungshintergrund und Motivation

Der Kern des Problems

Das traditionelle Regression-Diskontinuitäts-Design (RD) erfordert, dass jede Einheit nur einem Diskontinuitätsereignis ausgesetzt ist. In vielen empirischen Studien ist die Ergebnisvariable jedoch auf einer höheren Aggregationsebene als die Diskontinuitätsereignisse definiert. Beispiele:

Legislativstudien: Ergebnisse auf Bundesstaatsebene hängen von Wahlergebnissen in mehreren Einzelwahlkreisen ab
Zeitliche Aggregation: Einheiten sind über mehrere Perioden mehreren RD-Ereignissen ausgesetzt
Spillover-Effekte: Jede Einheit ist mehreren Wahlen von Nachbarn ausgesetzt

Bedeutung des Problems

Diese Einstellungen sind in der empirischen Forschung äußerst verbreitet und umfassen mehrere Bereiche wie politische Ökonomie, Arbeitsökonomie und öffentliche Finanzen. Die bestehende Literatur behandelt diese Situation normalerweise ad hoc, ohne einen einheitlichen theoretischen Rahmen und optimale Schätzmethoden.

Einschränkungen bestehender Methoden

Obere Spezifikation: Enthält normalerweise nicht alle notwendigen lokalen linearen Kontrollvariablen und verliert die Verzerrungsreduktionsvorteile des RD-Designs
Untere Spezifikation: Die meisten verwenden vereinfachte Formschätzungen ohne kohärentes Kausalmodell
Stichprobenbeschränkung: Einige Studien beschränken die Stichprobe unnötig und verringern die statistische Aussagekraft

Kernbeiträge

Theoretische Innovation: Präsentation des Regression-Diskontinuitäts-Aggregations-Rahmens (RDA), der RD-Designs auf Aggregationseinstellungen erweitert
Methodologischer Beitrag: Entwicklung von zwei Schätzern – oberer IV-Schätzer und unterer gestapelter Schätzer
Theoretischer Beweis: Nachweis, dass beide Schätzer unter ähnlichen Kontinuitätsannahmen denselben lokalen durchschnittlichen Behandlungseffekt identifizieren
Empirische Anwendung: Anwendung der RDA-Methode zur Untersuchung der Auswirkungen der amerikanischen Gewerkschaftstätigkeit auf Ungleichheit
Politische Bedeutung: Feststellung, dass Gewerkschaftstätigkeit die Lohnungleichheit innerhalb von Bundesstaat-Industrie-Einheiten erheblich verringert

Methodische Erklärung

Aufgabendefinition

Betrachten Sie N obere Einheiten i, von denen jede Ji untere Untereinheiten j enthält. Die Untereinheit j ist durch die Laufvariable rj und die Behandlung zj = 1rj ≥ 0 charakterisiert. Das Ziel ist die Schätzung des Kausalmodells:

Yi = βXi + εi

wobei Xi die obere Behandlungsvariable ist, normalerweise definiert als:

Xi = Σj∈Ji sj zj

Modellarchitektur

1. Oberer IV-Schätzer

Konstruktion von Instrumentalvariablen unter Verwendung von Untereinheiten nahe dem Cutoff:

Zi = Σj∈Ci sj zj

wobei Ci = {j ∈ Ji : |rj| ≤ h} die Menge der Untereinheiten nahe dem Cutoff ist.

Die Schlüsselinnovation ist die Aggregation von RDA-Kontrollvariablen:

Qi = (Σj∈Ci sj, Σj∈Ci sj rj, Σj∈Ci sj r+j)'

Schätzspezifikation:

Yi = βXi + γ0 Σj∈Ci sj + γ1 Σj∈Ci sj rj + γ2 Σj∈Ci sj r+j + γ̃'W̃i + Fehler i

2. Unterer gestapelter Schätzer

Schätzung der unscharfen RD-Spezifikation in der Stichprobe der Wahlen nahe dem Cutoff:

Yi(j) = βXi(j) + γ̃'W̃i(j) + λ'qj + Fehler j

wobei Xi(j) durch zj instrumentalisiert wird, qj = (1, rj, r+j) sind Standard-RD-Kontrollvariablen.

Technische Innovationspunkte

1. Theoretische Äquivalenz

Proposition 1 beweist die numerische Äquivalenz der oberen und unteren Schätzer: Der obere IV-Schätzer entspricht einem spezifischen unscharfen RD-Schätzer auf Untereinheitsebene.

2. Identifikationsergebnisse

Proposition 2 zeigt, dass beide Schätzer unter Standard-Kontinuitätsannahmen denselben lokalen durchschnittlichen Behandlungseffekt identifizieren:

β0 = E[sj · (Yi(j)(Xi(j)(1, zi(j)−j)) − Yi(j)(Xi(j)(0, zi(j)−j))) | rj = 0] / 
     E[sj · (Xi(j)(1, zi(j)−j) − Xi(j)(0, zi(j)−j)) | rj = 0]

3. Verzerrungsreduktionseigenschaften

Monte-Carlo-Simulationen zeigen, dass der Schätzer mit aggregierten lokalen linearen Kontrollvariablen die Verzerrungsreduktionseigenschaften traditioneller RD-Methoden erbt.

Experimentelle Einrichtung

Datensätze

Gewerkschaftswahldaten: Institutionelle Gewerkschaftswahldaten der NLRB von 1961-2009
Arbeitsmarktergebnisse: Basierend auf Zensusproben von 1960-2010 alle zehn Jahre
Ergänzungsdaten: Gewerkschaftsdichte und Leistungsdaten aus der Current Population Survey (CPS)

Behandlungsvariablen und Instrumentalvariablen

Behandlungsvariable: NewUnionssit, Anteil neu gewerkschaftlich organisierter Arbeitnehmer in der Bundesstaat-Industrie-Einheit
Instrumentalvariable: Zsit, Anteil der Arbeitnehmer, die durch nahe Wahlen (Abstimmungsanteil 50±10%) gewerkschaftlich organisiert wurden
RDA-Kontrollvariablen: Anteil der Arbeitnehmer in nahen Wahlen, durchschnittliche Abstimmungsdifferenz usw.

Bewertungsmetriken

Fünf Ungleichheitsindikatoren:

Logarithmus der Universitätsgehaltsprämie
Logarithmus des 90-10-Lohnverhältnisses
Gini-Koeffizient
Einkommensanteil der Top 10%
Logarithmische Lohnvarianz

Experimentelle Ergebnisse

Hauptergebnisse

Ungleichheitsauswirkungen

Für jeden Anstieg der neuen Gewerkschaftsquote um 1 Prozentpunkt:

Gini-Koeffizient sinkt um 0,018 (oberer Schätzer) / 0,013 (unterer Schätzer)
90-10-Verhältnis sinkt um 0,46 / 0,27 Logarithmuspunkte
Top-10%-Anteil sinkt um 0,14 / 0,12 Prozentpunkte
Logarithmische Lohnvarianz sinkt um 0,025 / 0,021

Lohnverteilungseffekte

Gewerkschaftstätigkeit reduziert Ungleichheit hauptsächlich durch Senkung der Löhne von Hochverdienern statt durch Erhöhung der Löhne von Niedrigverdienern:

Durchschnittlicher Lohnrückgang von 0,35 Logarithmuspunkten
Signifikanter Rückgang der Managerlöhne um 0,92 Logarithmuspunkte
Leichter, aber nicht signifikanter Anstieg des Lohns im 10. Perzentil

Leistungsmechanismen

Gewerkschaftstätigkeit erhöht die Rentnerversicherungsabdeckung erheblich: Jedes neue Gewerkschaftsmitglied entspricht einem Anstieg von 1,48 Rentnerversicherungsinhabern, was auf erhebliche Spillover-Effekte zwischen Institutionen hindeutet.

Historische Beitragsanalyse

Die kontrafaktische Analyse zeigt, dass bei Beibehaltung der neuen Gewerkschaftsquote auf dem Niveau der 1960er Jahre:

Gini-Koeffizient: Gewerkschaftsrückgang erklärt 34,5% des Anstiegs von 1970-2010
90-10-Verhältnis: Erklärt 33,7% des Anstiegs
Top-10%-Anteil: Erklärt 38,3% des Anstiegs
Universitätsprämie: Erklärt 60,5% des Anstiegs

Robustheitsprüfungen

Ergebnisse bleiben unter verschiedenen Spezifikationen robust:

Unterschiedliche Bandbreitenwahl (10% und 15%)
Ausschluss von Gewerkschaftsauflösungswahlen
Unterschiedliche Fixeffekt-Einstellungen
Gewichtete und ungewichtete Schätzungen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Methodologie: Der RDA-Rahmen bietet eine einheitliche theoretische Grundlage und optimale Schätzmethoden für die Behandlung aggregierter RD-Einstellungen
Empirische Ergebnisse: Gewerkschaftstätigkeit verringert die Lohnungleichheit erheblich, hauptsächlich durch Kompression der Lohnverteilung am oberen Ende
Politische Bedeutung: Der Gewerkschaftsrückgang ist ein wichtiger Faktor für den Anstieg der Ungleichheit in den USA

Einschränkungen

Extrapolierbarkeit: Basierend auf lokalen Veränderungen nahe Wahlen zur Extrapolation auf langfristige Effekte
Aggregationsebene: Berücksichtigt nur Ungleichheit innerhalb von Bundesstaat-Industrie-Einheiten, nicht zwischen Einheiten
Mechanismusidentifikation: Spezifische Mechanismen, durch die Gewerkschaften Ungleichheit beeinflussen, erfordern weitere Forschung

Zukünftige Richtungen

Erweiterung auf andere Aggregationseinstellungen und Spillover-Effekt-Studien
Entwicklung von Methoden zur Behandlung endogener Aggregationsstrukturen
Erforschung theoretischer Eigenschaften dynamischer RD-Aggregation

Tiefgreifende Bewertung

Stärken

Theoretischer Beitrag: Füllt eine Lücke in der RD-Literatur bei Aggregationseinstellungen und bietet eine strenge theoretische Grundlage
Methodische Innovation: Die beiden Schätzer sind clever konzipiert und erben die guten Eigenschaften traditioneller RD
Empirischer Wert: Bietet neue Kausalbeweise für wichtige Politikfragen
Hohe Praktikabilität: Die Methode ist auf ein breites Spektrum wirtschaftswissenschaftlicher Forschung anwendbar

Mängel

Komplexität: Im Vergleich zu Standard-RD ist die RDA-Methode komplexer umzusetzen
Annahmebedingungen: Erfordert stärkere Kontinuitätsannahmen zur Behandlung mehrerer Laufvariablen
Rechenlast: Besonders der untere Schätzer muss mit vielen wiederholten Beobachtungen umgehen

Auswirkungen

Akademischer Beitrag: Leistet wichtige Beiträge zur ökonometrischen Methodologie
Politische Relevanz: Bietet neue Werkzeuge für Arbeitsmarktpolitik und Ungleichheitsforschung
Reproduzierbarkeit: Bietet detaillierte Implementierungsrichtlinien und Code

Anwendungsszenarien

Legislativstudien in der politischen Ökonomie
Schuldenanleihen-Studien in der Bildungsökonomie
Spillover-Effekt-Studien in der Arbeitsökonomie
Jede wirtschaftswissenschaftliche Forschung mit aggregierten RD-Einstellungen

Literaturverzeichnis

Dieses Papier zitiert wichtige Literatur aus Ökonometrie, Arbeitsökonomie und politischer Ökonomie, besonders:

Borusyak et al. (2022) zur Shift-Share-Instrumentalvariablen-Forschung
Frandsen (2021) zur RD-Design-Forschung bei Gewerkschaftswahlen
Farber et al. (2021) zur Forschung über Gewerkschaften und Ungleichheit

Gesamtbewertung: Dies ist ein hochqualitatives ökonometrisches Methodologiepapier, das nicht nur wichtige theoretische Beiträge leistet, sondern auch den Wert der Methode durch bedeutungsvolle empirische Anwendungen demonstriert. Der RDA-Rahmen füllt eine Lücke in der Literatur und bietet für viele wirtschaftswissenschaftliche Studien eine geeignetere Identifikationsstrategie.