On Anticipation Effect in Stepped Wedge Cluster Randomized Trials
Wang, Chen, Courtright et al.
In stepped wedge cluster randomized trials (SW-CRTs), the intervention is rolled out to clusters over multiple periods. A standard approach for analyzing SW-CRTs utilizes the linear mixed model, where the treatment effect is only present after the treatment adoption, under the assumption of no anticipation. This assumption, however, may not always hold in practice because stakeholders, providers, or individuals who are aware of the treatment adoption timing (especially when blinding is challenging or infeasible) can inadvertently change their behaviors in anticipation of the forthcoming intervention. We provide an analytical framework to address the anticipation effect in SW-CRTs and study its impact. We derive expectations of the estimators based on a collection of linear mixed models and demonstrate that when the anticipation effect is ignored, these estimators give biased estimates of the treatment effect. We also provide updated sample size formulas that explicitly account for anticipation effects, exposure-time heterogeneity, or both in SW-CRTs and illustrate their impact on study power. Through simulation studies and empirical analyses, we compare the treatment effect estimators with and without adjusting for anticipation, and provide some practical considerations.
academic
О эффекте ожидания в ступенчатых клиновидных кластеризованных рандомизированных испытаниях
В ступенчатых клиновидных кластеризованных рандомизированных испытаниях (SW-CRTs) вмешательство постепенно внедряется в различные кластеры в течение нескольких периодов. Стандартные методы анализа используют линейные смешанные модели, предполагая, что эффект лечения проявляется только после внедрения вмешательства и отсутствует эффект ожидания. Однако это предположение может не выполняться на практике, поскольку заинтересованные стороны, поставщики услуг или отдельные лица, знающие время внедрения вмешательства (особенно когда ослепление затруднено или невозможно), могут непреднамеренно изменить своё поведение в ожидании предстоящего вмешательства. В данной статье предлагается аналитический框架для обработки эффекта ожидания в SW-CRTs и исследования его влияния. Авторы выводят математическое ожидание оценок на основе линейных смешанных моделей и доказывают, что при игнорировании эффекта ожидания эти оценки дают смещённые оценки эффекта лечения. Статья также предоставляет формулы расчёта объёма выборки, явно учитывающие эффект ожидания, гетерогенность времени воздействия или оба фактора, и иллюстрирует их влияние на мощность исследования.
Ступенчатые клиновидные кластеризованные рандомизированные испытания (SW-CRT) — это специальный дизайн испытания, при котором все кластеры первоначально находятся в контрольном состоянии, а затем в течение нескольких периодов в случайном порядке постепенно получают вмешательство. Традиционный анализ предполагает, что эффект лечения проявляется только после внедрения вмешательства и отсутствует эффект ожидания (anticipation effect).
Предположение об отсутствии ожидания: Почти все предыдущие работы предполагают отсутствие эффекта ожидания
Неправильная спецификация модели: Существующая литература в основном сосредоточена на гетерогенности времени воздействия, без систематического исследования эффекта ожидания
Расчёт объёма выборки: Существующие формулы расчёта объёма выборки не учитывают влияние эффекта ожидания
Теоретический框架: Впервые систематически предоставляет аналитический框架для эффекта ожидания в SW-CRTs, определяя четыре линейные смешанные модели (HH, HH-ANT, ETI, ETI-ANT)
Формулы смещения: Выводит замкнутые формулы смещения для 16 комбинаций истинной модели и рабочей модели, количественно оценивая влияние игнорирования эффекта ожидания и/или гетерогенности времени воздействия
Формулы дисперсии: Предоставляет выражения дисперсии для оценок эффекта лечения, учитывающие эффект ожидания, для расчёта объёма выборки
Методология расчёта объёма выборки: Разрабатывает формулы расчёта объёма выборки, явно учитывающие эффект ожидания, гетерогенность времени воздействия или оба фактора
Эмпирические доказательства: Проверяет теоретические результаты посредством моделирования и повторного анализа испытания REDAPS, предоставляя практические рекомендации
Программное обеспечение: Предоставляет функцию R (Trt.Ant.Power) для анализа мощности, учитывающего эффект ожидания
Статья определяет четыре линейные смешанные модели:
1. Модель HH (Hussey-Hughes) — базовая модель, предполагающая постоянный эффект лечения без ожидания:
Yijk=μ+αj+θZij+bi+ϵijk
2. Модель HH-ANT — модель с постоянным эффектом лечения, учитывающая эффект ожидания:
Yijk=μ+αj+γAij+θZij+bi+ϵijk
3. Модель ETI (Exposure Time Indicator) — учитывает гетерогенность времени воздействия без ожидания:
Yijk=μ+αj+θ(sij)Zij+bi+ϵijk
4. Модель ETI-ANT — одновременно учитывает эффект ожидания и гетерогенность времени воздействия:
Yijk=μ+αj+γAij+θ(sij)Zij+bi+ϵijk
где:
μ: общее среднее значение
αj: параметр долгосрочного тренда для периода j
θ или θ(s): эффект лечения
γ: эффект ожидания
bi∼N(0,τ2): случайный эффект кластера
ϵijk∼N(0,σ2): остаток
Определение индикатора ожидания:
Aij={1,0,j∗−l≤j<j∗впротивномслучае
где j∗ — период внедрения лечения, l — порядок эффекта ожидания (в статье в основном рассматривается l=1).
1. Систематический анализ неправильной спецификации модели
Статья исчерпывающе рассматривает 16 комбинаций истинной модели и рабочей модели (таблица 2), классифицируя их как:
Правильная спецификация (4 случая): рабочая модель совпадает с истинной моделью
Переспецификация (5 случаев): рабочая модель содержит ненужные параметры
Недоспецификация (5 случаев): рабочей модели не хватает важных параметров
Несоответствие (2 случая): рабочая модель неправильно специфицирует структуру параметров
2. Вывод формул смещения
Для стандартного дизайна SW-CRT статья выводит формулы смещения для ключевых сценариев:
Теорема 1 (истинная модель HH-ANT, рабочая модель HH):
E(θ^HH)=θHH−ANT+ωHHHH−ANTγHH−ANT
где вес:
ωHHHH−ANT=−(Q+1)(2+ϕQ)6(1+ϕQ)
Это показывает, что игнорирование эффекта ожидания приводит к смещённой оценке, направление смещения зависит от знака эффекта ожидания.
Теорема 2 (истинная модель ETI-ANT, рабочая модель HH):
E(θ^HH)=∑j=1J−1{πHHETI−ANT(j)θETI−ANT(j)+ωHHETI−ANT(j)γETI−ANT}
Ключевое открытие: некоторые веса πHHETI−ANT(j) могут быть отрицательными, что приводит к тому, что оценка может иметь противоположный знак истинному TATE.
3. Формулы дисперсии
Теорема 7: Для общего SW-CRT предоставляет выражения дисперсии для четырёх моделей:
Модель HH-ANT:
V(θ^HH−ANT)=KIJρ1ρ2σt2{ρ2(U2+IJU−JW1−IW2−I2JW52−W3)+ρ1(IW2−U2)}−1
где константы дизайна зависят от распределения лечения и индикатора ожидания.
Важные открытия:
V(θ^HH)<V(θ^HH−ANT)
Увеличение дисперсии растёт с увеличением ICC и уменьшением количества периодов
Для J=9 периодов увеличение дисперсии может достигать 40-50%
4. Расчёт объёма выборки и мощности
На основе формул дисперсии предоставляется формула мощности для двустороннего теста Вальда:
Power=Φ{V(θ^)∣θ∗∣−z1−α/2}
Однако следует отметить: когда рабочая модель неправильно специфицирована, θ^ сходится к смещённому значению, а не к истинному эффекту лечения, что приводит к увеличению ошибки первого рода.
Тест модели ETI на гетерогенность времени воздействия: p=0.15
Тест модели ETI-ANT на гетерогенность времени воздействия: p=0.36
Вывод: нет сильных доказательств гетерогенности времени воздействия, сосредоточение на HH и HH-ANT
Оценки эффекта лечения:
Модель HH: θ^=−1.23 (95% ДИ: -1.52 to -0.93)
Модель HH-ANT: θ^=−1.43 (95% ДИ: -1.76 to -1.10)
Разница: оценка HH-ANT показывает больший абсолютный эффект (сокращение времени консультации на 1.43 дня vs 1.23 дня)
Оценка эффекта ожидания:
Модель HH-ANT: γ^=−0.59 (95% ДИ: -1.01 to -0.17), статистически значимо
Интерпретация: время консультации сокращается на 0.59 дня до вмешательства, указывая на то, что клиницисты уже скорректировали поведение до официального внедрения
Практическое значение:
Игнорирование отрицательного эффекта ожидания приводит к недооценке эффекта лечения примерно на 14% (1.23 vs 1.43)
Образовательная подготовка принесла ранние выгоды
Эффект дополнительно усилился после официального внедрения
Wang et al. (2024): доказали, что линейные смешанные модели устойчивы к неправильной спецификации ковариат, случайных эффектов и структуры ошибок, но требовательны к структуре эффекта лечения
Chen & Li (2025): предложили уравнения оценки для эффектов, изменяющихся во времени, и информативного размера кластера
Корреляционная структура: рассматривают только сменяемую структуру, что может быть нереалистично на практике
Непрерывные результаты: для двоичных результатов (например, смертность) нет замкнутых решений, ограничивая применимость
Стандартный дизайн: основные результаты основаны на стандартном SW-CRT, неравномерное распределение и нерегулярные дизайны требуют дальнейшего исследования
2. Эмпирические недостатки:
Единственный случай: только одно применение реальных данных, требуется больше эмпирических доказательств
Обнаружение ожидания: не предоставляют статистический тест для обнаружения наличия эффекта ожидания
Анализ чувствительности: недостаточно исследуют чувствительность к неправильной спецификации ICC и размера эффекта ожидания
3. Практические рекомендации:
Правила решения: отсутствуют явные критерии для определения, когда следует учитывать эффект ожидания на этапе дизайна
Анализ затрат-выгод: не обсуждают компромисс между увеличением дисперсии и уменьшением смещения
Стратегии ослепления: меньше рекомендаций по практическому избежанию эффекта ожидания
4. Теоретические пробелы:
Причинный框架: не формализуют эффект ожидания в рамках потенциальных результатов
Временная зависимость: не рассматривают изменение эффекта ожидания во времени
Взаимодействия: не исследуют взаимодействие эффекта ожидания с индивидуальными характеристиками
Hussey MA, Hughes JP (2007). Design and analysis of stepped wedge cluster randomized trials. Contemporary Clinical Trials, 28(2):182-191.
Основополагающая статья по SW-CRT
Kenny A, et al. (2022). Analysis of stepped wedge cluster randomized trials in the presence of a time-varying treatment effect. Statistics in Medicine, 41(22):4311-4339.
Важная предшествующая работа по гетерогенности времени воздействия
Maleyeff L, et al. (2022). Assessing exposure-time treatment effect heterogeneity in stepped-wedge cluster randomized trials. Biometrics, 79(3):2551-2564.
Модель ETI со случайными эффектами
Courtright KR, et al. (2024). Default palliative care consultation for seriously ill hospitalized patients: a pragmatic cluster randomized trial. JAMA, 331(3):224-232.
Основные результаты испытания REDAPS
Hemming K, Taljaard M (2020). Reflection on modern methods: when is a stepped-wedge cluster randomized trial a good study design choice? International Journal of Epidemiology, 49(3):1043-1052.
Руководство по выбору дизайна SW-CRT
Общая оценка: Это высококачественная методологическая статья, заполняющая важный пробел в анализе SW-CRTs. Теория строгая, эмпирические доказательства достаточны, практическая ценность высока. Основной вклад заключается в систематической количественной оценке влияния эффекта ожидания и предоставлении операционализируемых решений. Ограничения в основном связаны с ограничениями предположений модели и широтой эмпирических доказательств. Рекомендуется осторожное применение на практике, сочетание с экспертным знанием области для оценки вероятности эффекта ожидания и проведение анализа чувствительности.