2025-11-19T20:13:14.047070

Regression discontinuity aggregation, with an application to the union effects on inequality

Borusyak, Kolerman-Shemer

We extend the regression discontinuity (RD) design to settings where each unit's treatment status is an average or aggregate across multiple discontinuity events. Such situations arise in many studies where the outcome is measured at a higher level of spatial or temporal aggregation (e.g., by state with district-level discontinuities) or when spillovers from discontinuity events are of interest. We propose two novel estimation procedures - one at the level at which the outcome is measured and the other in the sample of discontinuities - and show that both identify a local average causal effect under continuity assumptions similar to those of standard RD designs. We apply these ideas to study the effect of unionization on inequality in the United States. Using credible variation from close unionization elections at the establishment level, we show that a higher rate of newly unionized workers in a state-by-industry cell reduces wage inequality within the cell.

academic

Агрегирование регрессионного разрыва с применением к влиянию профсоюзов на неравенство

Основная информация

ID статьи: 2501.00428
Название: Regression discontinuity aggregation, with an application to the union effects on inequality
Авторы: Кирилл Борусяк (UC Berkeley), Матан Колерман-Шемер (Еврейский университет Иерусалима)
Классификация: econ.EM (Эконометрика)
Дата публикации: Декабрь 2024
Ссылка на статью: https://arxiv.org/abs/2501.00428

Аннотация

В данной работе регрессионный разрыв (RD) расширяется на случаи, когда статус обработки каждой единицы является средним или агрегированным значением множественных событий разрыва. Такие ситуации возникают во многих исследованиях, где результаты измеряются на более высоких уровнях пространственной или временной агрегации (например, по штатам в сравнении с региональными разрывами), или когда возникают побочные эффекты событий разрыва. Авторы предлагают две новые процедуры оценки — одну на уровне измерения результатов, другую в выборке разрыва — и показывают, что обе идентифицируют локальный средний причинный эффект при предположениях о непрерывности, аналогичных стандартному дизайну RD. Применяя эти идеи к исследованию влияния профсоюзации в США на неравенство, используя достоверные вариации выборов по профсоюзации на уровне учреждений, авторы показывают, что увеличение доли новых профсоюзированных рабочих в государственно-отраслевых единицах снижает неравенство заработной платы внутри единиц.

Исследовательский контекст и мотивация

Суть проблемы

Традиционный дизайн регрессионного разрыва (RD) требует, чтобы каждая единица была подвергнута воздействию только одного события разрыва. Однако во многих эмпирических исследованиях переменная результата определяется на более высоком уровне агрегации, чем события разрыва. Например:

Исследования законодательных органов: результаты на уровне штата зависят от результатов выборов в нескольких одномандатных округах
Временная агрегация: единицы подвергаются воздействию множественных событий RD в несколько периодов
Побочные эффекты: каждая единица подвергается воздействию множественных выборов соседей

Важность проблемы

Такие установки чрезвычайно распространены в эмпирических исследованиях, охватывая политическую экономику, экономику труда, государственные финансы и другие области. Существующая литература обычно использует ad hoc подходы для обработки таких ситуаций, не имея единой теоретической базы и оптимальных методов оценки.

Ограничения существующих методов

Верхняя спецификация: обычно не включает все необходимые локальные линейные контрольные переменные, теряя преимущества снижения смещения дизайна RD
Нижняя спецификация: большинство использует оценку в приведённой форме без определения согласованной причинной модели
Ограничение выборки: некоторые исследования ненужно ограничивают выборку, снижая статистическую мощность

Основные вклады

Теоретическое инновация: предложена структура агрегирования регрессионного разрыва (RDA), расширяющая дизайн RD на агрегированные установки
Методологический вклад: разработаны два оценивателя — верхний IV-оценитель и нижний стекированный оценитель
Теоретическое доказательство: показано, что оба оценителя идентифицируют одинаковый локальный средний эффект обработки при аналогичных предположениях о непрерывности
Эмпирическое применение: метод RDA применён к исследованию влияния профсоюзации в США на неравенство
Политическое значение: обнаружено, что профсоюзация значительно снижает неравенство заработной платы в государственно-отраслевых единицах

Детальное описание методологии

Определение задачи

Рассмотрим N верхних единиц i, каждая содержит Ji нижних подединиц j. Подединица j характеризуется переменной запуска rj и обработкой zj = 1rj ≥ 0. Цель состоит в оценке причинной модели:

Yi = βXi + εi

где Xi — верхняя переменная обработки, обычно определяемая как:

Xi = Σj∈Ji sj zj

Архитектура модели

1. Верхний IV-оценитель

Использует подединицы, близкие к точке разрыва, для построения инструментальной переменной:

Zi = Σj∈Ci sj zj

где Ci = {j ∈ Ji : |rj| ≤ h} — множество подединиц, близких к точке разрыва.

Ключевое инновация — агрегирование контрольных переменных RDA:

Qi = (Σj∈Ci sj, Σj∈Ci sj rj, Σj∈Ci sj r+j)'

Спецификация оценки:

Yi = βXi + γ0 Σj∈Ci sj + γ1 Σj∈Ci sj rj + γ2 Σj∈Ci sj r+j + γ̃'W̃i + errori

2. Нижний стекированный оценитель

Оценивает нечёткую спецификацию RD в выборке выборов, близких к точке разрыва:

Yi(j) = βXi(j) + γ̃'W̃i(j) + λ'qj + errorj

где Xi(j) инструментализирован с помощью zj, qj = (1, rj, r+j) — стандартные контрольные переменные RD.

Технические инновации

1. Теоретическая эквивалентность

Предложение 1 доказывает числовую эквивалентность верхнего и нижнего оценителей: верхний IV-оценитель равен конкретному нечёткому RD-оценителю на уровне подединиц.

2. Результаты идентификации

Предложение 2 показывает, что при стандартных предположениях о непрерывности оба оценителя идентифицируют одинаковый локальный средний эффект обработки:

β0 = E[sj · (Yi(j)(Xi(j)(1, zi(j)−j)) − Yi(j)(Xi(j)(0, zi(j)−j))) | rj = 0] / 
     E[sj · (Xi(j)(1, zi(j)−j) − Xi(j)(0, zi(j)−j)) | rj = 0]

3. Свойства снижения смещения

Моделирование методом Монте-Карло показывает, что оценитель, включающий агрегированные локальные линейные контрольные переменные, наследует свойства снижения смещения традиционных методов RD.

Экспериментальная установка

Наборы данных

Данные о профсоюзных выборах: данные о выборах на уровне учреждений 1961-2009 гг. из NLRB
Результаты рынка труда: основаны на выборках переписи населения за десятилетие 1960-2010 гг.
Дополнительные данные: данные о плотности профсоюзов и льготах из текущего обследования населения (CPS)

Переменные обработки и инструментальные переменные

Переменная обработки: NewUnionssit, доля новых профсоюзированных рабочих в государственно-отраслевой единице
Инструментальная переменная: Zsit, доля рабочих, профсоюзированных на близких выборах (доля голосов 50±10%)
Контрольные переменные RDA: включают долю рабочих на близких выборах, среднюю разницу голосов и т.д.

Показатели оценки

Пять показателей неравенства:

Логарифм премии за университетское образование
Логарифм соотношения 90-10 заработной платы
Коэффициент Джини
Доля доходов топ-10%
Логарифмическая дисперсия заработной платы

Результаты экспериментов

Основные результаты

Влияние на неравенство

При увеличении доли новой профсоюзации на 1 процентный пункт:

Коэффициент Джини снижается на 0,018 (верхний оценитель) / 0,013 (нижний оценитель)
Соотношение 90-10 снижается на 0,46 / 0,27 логарифмических пункта
Доля топ-10% снижается на 0,14 / 0,12 процентных пункта
Логарифмическая дисперсия заработной платы снижается на 0,025 / 0,021

Эффекты распределения заработной платы

Профсоюзация снижает неравенство в основном путём снижения заработной платы высокооплачиваемых работников, а не повышения заработной платы низкооплачиваемых:

Средняя заработная плата снижается на 0,35 логарифмических пункта
Заработная плата управленцев значительно снижается на 0,92 логарифмических пункта
Заработная плата на 10-м процентиле немного повышается, но не значимо

Механизм льгот

Профсоюзация значительно повышает охват пенсионными планами: каждый новый член профсоюза соответствует увеличению на 1,48 держателей пенсий, указывая на значительные побочные эффекты между учреждениями.

Анализ исторического вклада

Контрфактический анализ показывает, что если бы доля новой профсоюзации оставалась на уровне 1960-х годов:

Коэффициент Джини: снижение профсоюзов объясняет 34,5% роста в 1970-2010 гг.
Соотношение 90-10: объясняет 33,7% роста
Доля топ-10%: объясняет 38,3% роста
Премия за университетское образование: объясняет 60,5% роста

Проверки устойчивости

Результаты остаются устойчивыми при различных спецификациях:

Различные выборы полосы пропускания (10% и 15%)
Исключение выборов по роспуску профсоюзов
Различные установки фиксированных эффектов
Взвешенные и невзвешенные оценки

Связанные работы

Литература по RD

Данная работа расширяет стандартный дизайн RD, отличаясь от многомерного дизайна RD тем, что многомерный RD обрабатывает множественные переменные запуска на одной границе, тогда как RDA обрабатывает агрегированные удары RD.

Теоретический анализ основан на литературе по инструментальным переменным shift-share, в частности на результатах числовой эквивалентности Borusyak et al. (2022).

Литература о профсоюзах и неравенстве

Предоставляет новую стратегию причинной идентификации для влияния профсоюзов на неравенство, дополняя исследования, основанные на наблюдаемости выбора, такие как Farber et al. (2021).

Заключение и обсуждение

Основные выводы

Методология: структура RDA обеспечивает единую теоретическую основу и оптимальные методы оценки для обработки агрегированных установок RD
Эмпирические результаты: профсоюзация значительно снижает неравенство заработной платы, в основном путём сжатия верхнего распределения заработной платы
Политическое значение: снижение профсоюзов является важным фактором роста неравенства в США

Ограничения

Экстраполируемость: основана на локальных изменениях вблизи выборов, экстраполируется на долгосрочные эффекты
Уровень агрегации: рассматривает только неравенство внутри государственно-отраслевых единиц, не охватывает неравенство между единицами
Идентификация механизма: требуется дальнейшее исследование конкретных механизмов влияния профсоюзов на неравенство

Будущие направления

Расширение на другие агрегированные установки и исследования побочных эффектов
Разработка методов обработки эндогенной агрегированной структуры
Исследование теоретических свойств динамического агрегирования RD

Глубокая оценка

Преимущества

Теоретический вклад: заполняет пробел в литературе RD в агрегированных установках, обеспечивая строгую теоретическую основу
Методологическое инновация: два оценителя разработаны умело, наследуя хорошие свойства традиционного RD
Эмпирическая ценность: предоставляет новые причинные доказательства для важных политических вопросов
Практическая применимость: метод применим к широкому спектру экономических исследований

Недостатки

Сложность: метод RDA более сложен в реализации по сравнению со стандартным RD
Предположения: требует более сильных предположений о непрерывности для обработки множественных переменных запуска
Вычислительная нагрузка: особенно нижний оценитель требует обработки большого количества повторяющихся наблюдений

Влияние

Академический вклад: делает важный вклад в методологию эконометрики
Политическая релевантность: предоставляет новый инструмент для исследований трудовой политики и неравенства
Воспроизводимость: предоставляет подробные инструкции по реализации и код

Сценарии применения

Исследования законодательных органов в политической экономике
Исследования школьных облигаций в экономике образования
Исследования побочных эффектов в экономике труда
Любые экономические исследования, связанные с агрегированными установками RD

Библиография

Данная работа цитирует важную литературу по эконометрике, экономике труда и политической экономике, в частности:

Borusyak et al. (2022) об инструментальных переменных shift-share
Frandsen (2021) о дизайне RD для профсоюзных выборов
Farber et al. (2021) о профсоюзах и неравенстве

Общая оценка: Это высококачественная статья по методологии эконометрики, которая не только предоставляет важный теоретический вклад, но и демонстрирует ценность метода через значимое эмпирическое применение. Структура RDA заполняет пробел в литературе и предоставляет более подходящую стратегию идентификации для многих экономических исследований.