2025-11-18T03:43:13.646477

On Anticipation Effect in Stepped Wedge Cluster Randomized Trials

Wang, Chen, Courtright et al.
In stepped wedge cluster randomized trials (SW-CRTs), the intervention is rolled out to clusters over multiple periods. A standard approach for analyzing SW-CRTs utilizes the linear mixed model, where the treatment effect is only present after the treatment adoption, under the assumption of no anticipation. This assumption, however, may not always hold in practice because stakeholders, providers, or individuals who are aware of the treatment adoption timing (especially when blinding is challenging or infeasible) can inadvertently change their behaviors in anticipation of the forthcoming intervention. We provide an analytical framework to address the anticipation effect in SW-CRTs and study its impact. We derive expectations of the estimators based on a collection of linear mixed models and demonstrate that when the anticipation effect is ignored, these estimators give biased estimates of the treatment effect. We also provide updated sample size formulas that explicitly account for anticipation effects, exposure-time heterogeneity, or both in SW-CRTs and illustrate their impact on study power. Through simulation studies and empirical analyses, we compare the treatment effect estimators with and without adjusting for anticipation, and provide some practical considerations.
academic

О эффекте ожидания в ступенчатых клиновидных кластеризованных рандомизированных испытаниях

Основная информация

  • ID статьи: 2504.08158
  • Название: On Anticipation Effect in Stepped Wedge Cluster Randomized Trials
  • Авторы: Hao Wang, Xinyuan Chen, Katherine R. Courtright, Scott D. Halpern, Michael O. Harhay, Monica Taljaard, Fan Li
  • Классификация: stat.ME (Статистика - Методология)
  • Дата публикации: 14 ноября 2025 г. (arXiv v2)
  • Ссылка на статью: https://arxiv.org/abs/2504.08158

Аннотация

В ступенчатых клиновидных кластеризованных рандомизированных испытаниях (SW-CRTs) вмешательство постепенно внедряется в различные кластеры в течение нескольких периодов. Стандартные методы анализа используют линейные смешанные модели, предполагая, что эффект лечения проявляется только после внедрения вмешательства и отсутствует эффект ожидания. Однако это предположение может не выполняться на практике, поскольку заинтересованные стороны, поставщики услуг или отдельные лица, знающие время внедрения вмешательства (особенно когда ослепление затруднено или невозможно), могут непреднамеренно изменить своё поведение в ожидании предстоящего вмешательства. В данной статье предлагается аналитический框架для обработки эффекта ожидания в SW-CRTs и исследования его влияния. Авторы выводят математическое ожидание оценок на основе линейных смешанных моделей и доказывают, что при игнорировании эффекта ожидания эти оценки дают смещённые оценки эффекта лечения. Статья также предоставляет формулы расчёта объёма выборки, явно учитывающие эффект ожидания, гетерогенность времени воздействия или оба фактора, и иллюстрирует их влияние на мощность исследования.

Исследовательский контекст и мотивация

Исследовательская проблема

Ступенчатые клиновидные кластеризованные рандомизированные испытания (SW-CRT) — это специальный дизайн испытания, при котором все кластеры первоначально находятся в контрольном состоянии, а затем в течение нескольких периодов в случайном порядке постепенно получают вмешательство. Традиционный анализ предполагает, что эффект лечения проявляется только после внедрения вмешательства и отсутствует эффект ожидания (anticipation effect).

Важность проблемы

  1. Распространённость на практике: Во многих SW-CRTs ослепление является сложным или невозможным, и участники могут заранее узнать время вмешательства
  2. Изменение поведения: Члены кластеров, знающие о предстоящем вмешательстве, могут изменить своё поведение, создавая эффект ожидания
  3. Смещение оценок: Игнорирование эффекта ожидания может привести к серьёзному смещению оценок эффекта лечения

Ограничения существующих методов

  1. Предположение об отсутствии ожидания: Почти все предыдущие работы предполагают отсутствие эффекта ожидания
  2. Неправильная спецификация модели: Существующая литература в основном сосредоточена на гетерогенности времени воздействия, без систематического исследования эффекта ожидания
  3. Расчёт объёма выборки: Существующие формулы расчёта объёма выборки не учитывают влияние эффекта ожидания

Исследовательская мотивация

  • Систематически исследовать влияние эффекта ожидания на анализ SW-CRTs
  • Количественно оценить смещение, вызванное неправильной спецификацией модели
  • Предоставить методы расчёта объёма выборки для дизайна испытания, учитывающие эффект ожидания
  • Предоставить практические рекомендации

Основные вклады

  1. Теоретический框架: Впервые систематически предоставляет аналитический框架для эффекта ожидания в SW-CRTs, определяя четыре линейные смешанные модели (HH, HH-ANT, ETI, ETI-ANT)
  2. Формулы смещения: Выводит замкнутые формулы смещения для 16 комбинаций истинной модели и рабочей модели, количественно оценивая влияние игнорирования эффекта ожидания и/или гетерогенности времени воздействия
  3. Формулы дисперсии: Предоставляет выражения дисперсии для оценок эффекта лечения, учитывающие эффект ожидания, для расчёта объёма выборки
  4. Методология расчёта объёма выборки: Разрабатывает формулы расчёта объёма выборки, явно учитывающие эффект ожидания, гетерогенность времени воздействия или оба фактора
  5. Эмпирические доказательства: Проверяет теоретические результаты посредством моделирования и повторного анализа испытания REDAPS, предоставляя практические рекомендации
  6. Программное обеспечение: Предоставляет функцию R (Trt.Ant.Power) для анализа мощности, учитывающего эффект ожидания

Подробное описание методов

Определение задачи

Входные данные:

  • I кластеров, J периодов, K индивидов в каждом кластере-периоде
  • Переменная результата YijkY_{ijk}: непрерывный результат для индивида k в кластере i в период j
  • Индикатор лечения ZijZ_{ij}: получает ли кластер i лечение в период j
  • Индикатор ожидания AijA_{ij}: находится ли кластер i в периоде ожидания в период j

Выходные данные:

  • Оценка эффекта лечения: θ^\hat{\theta} (постоянный эффект) или θ^(s)\hat{\theta}(s) (точечный эффект лечения для времени воздействия s)
  • Временно-усреднённый эффект лечения (TATE): Δ=1J1s=1J1θ(s)\Delta = \frac{1}{J-1}\sum_{s=1}^{J-1}\theta(s)
  • Оценка эффекта ожидания: γ^\hat{\gamma}

Архитектура модели

Статья определяет четыре линейные смешанные модели:

1. Модель HH (Hussey-Hughes) — базовая модель, предполагающая постоянный эффект лечения без ожидания: Yijk=μ+αj+θZij+bi+ϵijkY_{ijk} = \mu + \alpha_j + \theta Z_{ij} + b_i + \epsilon_{ijk}

2. Модель HH-ANT — модель с постоянным эффектом лечения, учитывающая эффект ожидания: Yijk=μ+αj+γAij+θZij+bi+ϵijkY_{ijk} = \mu + \alpha_j + \gamma A_{ij} + \theta Z_{ij} + b_i + \epsilon_{ijk}

3. Модель ETI (Exposure Time Indicator) — учитывает гетерогенность времени воздействия без ожидания: Yijk=μ+αj+θ(sij)Zij+bi+ϵijkY_{ijk} = \mu + \alpha_j + \theta(s_{ij})Z_{ij} + b_i + \epsilon_{ijk}

4. Модель ETI-ANT — одновременно учитывает эффект ожидания и гетерогенность времени воздействия: Yijk=μ+αj+γAij+θ(sij)Zij+bi+ϵijkY_{ijk} = \mu + \alpha_j + \gamma A_{ij} + \theta(s_{ij})Z_{ij} + b_i + \epsilon_{ijk}

где:

  • μ\mu: общее среднее значение
  • αj\alpha_j: параметр долгосрочного тренда для периода j
  • θ\theta или θ(s)\theta(s): эффект лечения
  • γ\gamma: эффект ожидания
  • biN(0,τ2)b_i \sim N(0,\tau^2): случайный эффект кластера
  • ϵijkN(0,σ2)\epsilon_{ijk} \sim N(0,\sigma^2): остаток

Определение индикатора ожидания: Aij={1,jlj<j0,в противном случаеA_{ij} = \begin{cases} 1, & j^* - l \leq j < j^* \\ 0, & \text{в противном случае} \end{cases} где jj^* — период внедрения лечения, ll — порядок эффекта ожидания (в статье в основном рассматривается l=1l=1).

Технические инновации

1. Систематический анализ неправильной спецификации модели

Статья исчерпывающе рассматривает 16 комбинаций истинной модели и рабочей модели (таблица 2), классифицируя их как:

  • Правильная спецификация (4 случая): рабочая модель совпадает с истинной моделью
  • Переспецификация (5 случаев): рабочая модель содержит ненужные параметры
  • Недоспецификация (5 случаев): рабочей модели не хватает важных параметров
  • Несоответствие (2 случая): рабочая модель неправильно специфицирует структуру параметров

2. Вывод формул смещения

Для стандартного дизайна SW-CRT статья выводит формулы смещения для ключевых сценариев:

Теорема 1 (истинная модель HH-ANT, рабочая модель HH): E(θ^HH)=θHHANT+ωHHHHANTγHHANTE(\hat{\theta}_{HH}) = \theta^{HH-ANT} + \omega_{HH}^{HH-ANT}\gamma^{HH-ANT} где вес: ωHHHHANT=6(1+ϕQ)(Q+1)(2+ϕQ)\omega_{HH}^{HH-ANT} = -\frac{6(1+\phi Q)}{(Q+1)(2+\phi Q)}

Это показывает, что игнорирование эффекта ожидания приводит к смещённой оценке, направление смещения зависит от знака эффекта ожидания.

Теорема 2 (истинная модель ETI-ANT, рабочая модель HH): E(θ^HH)=j=1J1{πHHETIANT(j)θETIANT(j)+ωHHETIANT(j)γETIANT}E(\hat{\theta}_{HH}) = \sum_{j=1}^{J-1}\left\{\pi_{HH}^{ETI-ANT}(j)\theta^{ETI-ANT}(j) + \omega_{HH}^{ETI-ANT}(j)\gamma^{ETI-ANT}\right\}

Ключевое открытие: некоторые веса πHHETIANT(j)\pi_{HH}^{ETI-ANT}(j) могут быть отрицательными, что приводит к тому, что оценка может иметь противоположный знак истинному TATE.

3. Формулы дисперсии

Теорема 7: Для общего SW-CRT предоставляет выражения дисперсии для четырёх моделей:

Модель HH-ANT: V(θ^HHANT)=IJρ1ρ2σt2K{ρ2(U2+IJUJW1IW2JW52I2W3)+ρ1(IW2U2)}1V(\hat{\theta}_{HH-ANT}) = \frac{IJ\rho_1\rho_2\sigma_t^2}{K}\left\{\rho_2(U^2+IJU-JW_1-IW_2-\frac{JW_5^2}{I^2}-W_3) + \rho_1(IW_2-U^2)\right\}^{-1}

где константы дизайна зависят от распределения лечения и индикатора ожидания.

Важные открытия:

  • V(θ^HH)<V(θ^HHANT)V(\hat{\theta}_{HH}) < V(\hat{\theta}_{HH-ANT})
  • Увеличение дисперсии растёт с увеличением ICC и уменьшением количества периодов
  • Для J=9 периодов увеличение дисперсии может достигать 40-50%

4. Расчёт объёма выборки и мощности

На основе формул дисперсии предоставляется формула мощности для двустороннего теста Вальда: Power=Φ{θV(θ^)z1α/2}\text{Power} = \Phi\left\{\frac{|\theta^*|}{\sqrt{V(\hat{\theta})}} - z_{1-\alpha/2}\right\}

Однако следует отметить: когда рабочая модель неправильно специфицирована, θ^\hat{\theta} сходится к смещённому значению, а не к истинному эффекту лечения, что приводит к увеличению ошибки первого рода.

Экспериментальная установка

Дизайн исследования моделирования

Стандартная установка SW-CRT:

  • I = 32 кластера
  • J = 9 периодов (Q = 8 последовательностей лечения)
  • K = 100 индивидов/кластер-период
  • ICC: ρ=τ2/(τ2+σ2)0.0195\rho = \tau^2/(\tau^2+\sigma^2) \approx 0.0195 (τ2=0.1412\tau^2=0.141^2, σ2=1\sigma^2=1)
  • Эффекты периода: αj=j\alpha_j = j
  • 2000 повторений моделирования

Четыре исследования моделирования:

  1. Исследование I: истинная модель HH (θ=0\theta=0 или 0.0750.075), рабочие модели HH и HH-ANT
    • Цель: сравнение ошибки первого рода и мощности
  2. Исследование II: истинная модель HH-ANT (θ=0.075\theta=0.075, γ=0.04\gamma=0.04), рабочие модели HH/HH-ANT/ETI/ETI-ANT
    • Цель: оценка смещения при игнорировании эффекта ожидания
  3. Исследование III: истинная модель ETI (синусоидальная функция), рабочие модели HH/HH-ANT/ETI/ETI-ANT
    • Цель: оценка сценариев несоответствия (HH-ANT vs HH)
  4. Исследование IV: истинная модель ETI-ANT (синусоидальная функция + ожидание), рабочие модели HH/HH-ANT/ETI/ETI-ANT
    • Цель: комплексная оценка

Функция гетерогенности времени воздействия: θETI(s)=1.41sin{2π(s1)/7}+0.12\theta^{ETI}(s) = -1.41\sin\{2\pi(s-1)/7\} + 0.12 TATE = 0.12

Эмпирическое исследование: испытание REDAPS

Фон испытания:

  • Название: Randomized Evaluation of Default Access to Palliative Services
  • Дизайн: 11 больниц (кластеров), 12 периодов, 32 месяца
  • Вмешательство: консультация паллиативной помощи по умолчанию vs обычная помощь
  • Результат: время консультации пациента (дни)
  • Объём выборки: 6,811 пациентов

Возможность эффекта ожидания:

  • Клиницисты не ослеплены (сохраняют возможность отменить заказ по умолчанию)
  • Образовательная подготовка за 3 месяца до вмешательства
  • Уведомление и коммуникация за 2 недели до вмешательства

Метрики оценки

  1. Смещение: Bias=E(θ^)θ\text{Bias} = E(\hat{\theta}) - \theta
  2. Эмпирическое стандартное отклонение: стандартное отклонение Монте-Карло
  3. Стандартная ошибка модели: средняя стандартная ошибка на основе модели
  4. Охват: эмпирический процент доверительных интервалов 95%
  5. Мощность: процент отклонений H0:θ=0H_0: \theta=0 (уровень значимости 0.05)

Результаты экспериментов

Основные результаты

Исследование моделирования I: истинная модель HH

Результаты таблицы 3:

Истинная модельРабочая модельθ\thetaθ^\hat{\theta}sd(θ^\hat{\theta})se(θ^\hat{\theta})Охват (%)Мощность (%)
HHHH00.00010.02010.020395.504.50
HHHH-ANT00.00000.02390.024095.554.45
HHHH0.0750.07510.02010.020395.5096.25
HHHH-ANT0.0750.07500.02390.024095.5588.15

Ключевые открытия:

  1. Обе модели несмещённые
  2. Модель HH имеет меньшую стандартную ошибку (0.0203 vs 0.0240), более эффективна
  3. Модель HH имеет большую мощность (96.25% vs 88.15%)
  4. Ненужная корректировка эффекта ожидания приводит к увеличению дисперсии примерно на 19%

Исследование моделирования II: истинная модель HH-ANT

Результаты таблицы 3 (θ=0.075\theta=0.075, γ=0.04\gamma=0.04):

Рабочая модельθ^\hat{\theta}γ^\hat{\gamma}Охват(θ\theta)Мощность(θ\theta)Охват(γ\gamma)Мощность(γ\gamma)
HH0.0521-79.85%73.35%--
HH-ANT0.07500.039995.55%88.15%94.60%42.75%
ETI0.0318-73.85%15.85%--
ETI-ANT0.07560.040095.45%42.75%94.45%34.80%

Ключевые открытия:

  1. Серьёзное недооценивание: модель HH оценивает 0.0521 (истинное значение 0.075), относительное смещение -31%
  2. Несоответствие хуже: модель ETI оценивает 0.0318, относительное смещение -58%, подтверждая теоретические предсказания
  3. Правильная модель: HH-ANT и ETI-ANT оба несмещённые, сохраняют номинальный охват
  4. Эффективность: HH-ANT более эффективна, чем ETI-ANT (se: 0.0240 vs 0.0426)

Исследование моделирования III: истинная модель ETI

Результаты таблицы 4 (синусоидальная функция, Δ=0.12\Delta=0.12):

Рабочая модельΔ^\hat{\Delta}γ^\hat{\gamma}ОхватМощность
HH-0.8480-0.00%100.00%
HH-ANT-1.1072-0.43020.00%100.00%
ETI0.1206-94.65%95.75%
ETI-ANT0.12060.000095.45%80.75%

Ключевые открытия:

  1. Обращение знака: HH и HH-ANT дают отрицательные оценки (истинное значение положительное), охват 0%
  2. Несоответствие ухудшает: HH-ANT (-1.1072) имеет большее смещение, чем HH (-0.8480)
  3. Правильная модель: ETI и ETI-ANT несмещённые
  4. Оценка ожидания: HH-ANT неправильно оценивает γ=0.4302\gamma=-0.4302 (истинное значение 0), подтверждая теорию отрицательных весов

Исследование моделирования IV: истинная модель ETI-ANT

Результаты таблицы 4 (синусоидальная функция + ожидание, Δ=0.12\Delta=0.12, γ=0.04\gamma=0.04):

Рабочая модельΔ^\hat{\Delta}γ^\hat{\gamma}Охват(Δ\Delta)Мощность(Δ\Delta)
HH-0.8721-0.00%100.00%
HH-ANT-1.1072-0.39020.00%100.00%
ETI0.0768-73.85%66.50%
ETI-ANT0.12060.040095.45%80.75%

Ключевые открытия:

  1. Двойная неправильная спецификация: HH и HH-ANT серьёзно смещены
  2. Обращение знака ожидания: HH-ANT оценивает γ=0.3902\gamma=-0.3902 (истинное значение +0.04)
  3. Единственная ошибка: ETI недооценивает (0.0768 vs 0.12), относительное смещение -36%
  4. Правильная модель: только ETI-ANT несмещённая и имеет правильный охват

Эмпирический анализ: испытание REDAPS

Тест отношения правдоподобия:

  • Тест модели ETI на гетерогенность времени воздействия: p=0.15
  • Тест модели ETI-ANT на гетерогенность времени воздействия: p=0.36
  • Вывод: нет сильных доказательств гетерогенности времени воздействия, сосредоточение на HH и HH-ANT

Оценки эффекта лечения:

  • Модель HH: θ^=1.23\hat{\theta}=-1.23 (95% ДИ: -1.52 to -0.93)
  • Модель HH-ANT: θ^=1.43\hat{\theta}=-1.43 (95% ДИ: -1.76 to -1.10)
  • Разница: оценка HH-ANT показывает больший абсолютный эффект (сокращение времени консультации на 1.43 дня vs 1.23 дня)

Оценка эффекта ожидания:

  • Модель HH-ANT: γ^=0.59\hat{\gamma}=-0.59 (95% ДИ: -1.01 to -0.17), статистически значимо
  • Интерпретация: время консультации сокращается на 0.59 дня до вмешательства, указывая на то, что клиницисты уже скорректировали поведение до официального внедрения

Практическое значение:

  1. Игнорирование отрицательного эффекта ожидания приводит к недооценке эффекта лечения примерно на 14% (1.23 vs 1.43)
  2. Образовательная подготовка принесла ранние выгоды
  3. Эффект дополнительно усилился после официального внедрения

Анализ мощности

Увеличение дисперсии (рисунок 6):

  • J=5 периодов: увеличение дисперсии 40-90% (в зависимости от ICC)
  • J=9 периодов: увеличение дисперсии 40-50%
  • J=33 периода: увеличение дисперсии только 10% (при ρ>0.02\rho>0.02)

Относительная мощность (веб-рисунки 3-7):

  • Зависит от отношения γ/θ\gamma/\theta и ICC
  • J=5, θ=0.1\theta=0.1: мощность HH-ANT выше, когда γ/θ>0.295\gamma/\theta>0.295
  • Абсолютная разница мощности увеличивается с уменьшением J и увеличением ρ\rho

Связанные работы

Методы анализа SW-CRT

  1. Hussey & Hughes (2007): предложили модель со случайным пересечением (модель HH)
  2. Hughes et al. (2015): впервые предложили структуры эффекта лечения с задержкой, линейные и нелинейные
  3. Nickless et al. (2018): предложили модель ETI для обработки кумулятивных эффектов времени воздействия

Гетерогенность времени воздействия

  1. Kenny et al. (2022): доказали серьёзное смещение при предположении постоянного эффекта лечения, возможно обращение знака
  2. Maleyeff et al. (2022): предложили модель ETI со случайными эффектами и тест перестановок
  3. Lee et al. (2025): различают эффекты времени воздействия и календарного времени

Устойчивость модели

  1. Wang et al. (2024): доказали, что линейные смешанные модели устойчивы к неправильной спецификации ковариат, случайных эффектов и структуры ошибок, но требовательны к структуре эффекта лечения
  2. Chen & Li (2025): предложили уравнения оценки для эффектов, изменяющихся во времени, и информативного размера кластера

Позиционирование вклада данной работы

  • Первое систематическое исследование: влияния эффекта ожидания на SW-CRTs
  • Заполнение пробела: существующая литература почти полностью игнорирует эффект ожидания
  • Комплексное рассмотрение: одновременная обработка эффекта ожидания и гетерогенности времени воздействия
  • Практические инструменты: предоставление методов расчёта объёма выборки и программного обеспечения

Выводы и обсуждение

Основные выводы

1. Руководство по выбору модели:

  • Без гетерогенности: модель HH наиболее эффективна
  • Только эффект ожидания: модель HH-ANT несмещённая, но дисперсия увеличивается на 10-90%
  • Только гетерогенность времени воздействия: модель ETI несмещённая
  • Оба фактора: требуется модель ETI-ANT

2. Паттерны смещения:

  • Игнорирование эффекта ожидания приводит к ослаблению или усилению эффекта лечения (в зависимости от знака γ\gamma)
  • Сценарии несоответствия (HH-ANT при истинной ETI) хуже, чем недоспецификация (HH)
  • Отрицательные веса могут привести к обращению знака оценки

3. Дизайн испытания:

  • Учёт эффекта ожидания приводит к значительному увеличению объёма выборки
  • Корректировка на этапе дизайна оправдана только при высокой вероятности эффекта ожидания
  • Ослепление и отложенное уведомление — предпочтительные стратегии

Ограничения

1. Предположения модели:

  • Рассматривают только эффекты времени воздействия, не календарного времени
  • Предполагают простую сменяемую корреляционную структуру
  • Сосредоточены на непрерывных результатах, двоичные и счётные результаты требуют расширения

2. Структура эффекта ожидания:

  • В основном рассматривают первый порядок ожидания (l=1l=1)
  • Предполагают постоянный эффект ожидания, не учитывают гетерогенность времени ожидания
  • Не предоставляют методы проверки гипотез для порядка ожидания

3. Ограничения анализа:

  • Предположение о правильной спецификации корреляционной структуры
  • Не рассматривают одновременную неправильную спецификацию эффекта лечения и корреляционной структуры
  • Сравнение мощности ограничено конкретными параметрическими установками

Будущие направления

1. Расширение методов:

  • Разработка методов проверки гипотез для порядка ожидания и гетерогенности времени ожидания
  • Расширение на обобщённые линейные смешанные модели (двоичные, счётные результаты)
  • Исследование более сложных корреляционных структур (вложенная сменяемость, дискретное затухание во времени)

2. Оптимизация дизайна:

  • Рассмотрение неполных дизайнов внедрения для снижения влияния ожидания
  • Оптимизация распределения последовательности лечения для минимизации смещения ожидания
  • Разработка адаптивных методов дизайна

3. Причинный вывод:

  • Переформулировка оценок в рамках потенциальных результатов
  • Различение причинных путей эффекта ожидания и истинного эффекта лечения
  • Методы анализа чувствительности

4. Практическое применение:

  • Систематический обзор эмпирических доказательств эффекта ожидания в SW-CRTs
  • Разработка инструментов оценки вероятности эффекта ожидания
  • Разработка руководящих принципов отчётности

Глубокая оценка

Преимущества

1. Теоретический вклад:

  • Систематичность: впервые исчерпывающе рассматривает 16 комбинаций моделей, предоставляя полный теоретический框架
  • Строгость: выводит замкнутые формулы смещения и дисперсии, математический вывод детальный (50 страниц приложения)
  • Инновативность: открытие, что сценарии несоответствия могут быть хуже, чем недоспецификация, оспаривает традиционное понимание

2. Методологическая ценность:

  • Операционализируемость: предоставляет пакет R и функцию расчёта объёма выборки
  • Практичность: основана на стандартных линейных смешанных моделях, легко реализуется
  • Универсальность:框架может быть расширена на другие дизайны (неполные SW-CRTs)

3. Эмпирическая поддержка:

  • Достаточное моделирование: 4 исследования моделирования охватывают ключевые сценарии, каждое с 2000 повторениями
  • Реальные данные: анализ испытания REDAPS предоставляет убедительные эмпирические доказательства
  • Визуализация: 20+ графиков ясно демонстрируют паттерны смещения и функции весов

4. Качество написания:

  • Структура ясна, логика от мотивации к теории к применению строгая
  • Баланс между техническими деталями и интуитивными объяснениями хорошо достигнут
  • Таблица 2 предоставляет отличную дорожную карту исследования

Недостатки

1. Методологические ограничения:

  • Корреляционная структура: рассматривают только сменяемую структуру, что может быть нереалистично на практике
  • Непрерывные результаты: для двоичных результатов (например, смертность) нет замкнутых решений, ограничивая применимость
  • Стандартный дизайн: основные результаты основаны на стандартном SW-CRT, неравномерное распределение и нерегулярные дизайны требуют дальнейшего исследования

2. Эмпирические недостатки:

  • Единственный случай: только одно применение реальных данных, требуется больше эмпирических доказательств
  • Обнаружение ожидания: не предоставляют статистический тест для обнаружения наличия эффекта ожидания
  • Анализ чувствительности: недостаточно исследуют чувствительность к неправильной спецификации ICC и размера эффекта ожидания

3. Практические рекомендации:

  • Правила решения: отсутствуют явные критерии для определения, когда следует учитывать эффект ожидания на этапе дизайна
  • Анализ затрат-выгод: не обсуждают компромисс между увеличением дисперсии и уменьшением смещения
  • Стратегии ослепления: меньше рекомендаций по практическому избежанию эффекта ожидания

4. Теоретические пробелы:

  • Причинный框架: не формализуют эффект ожидания в рамках потенциальных результатов
  • Временная зависимость: не рассматривают изменение эффекта ожидания во времени
  • Взаимодействия: не исследуют взаимодействие эффекта ожидания с индивидуальными характеристиками

Влияние

1. Академическое влияние:

  • Смена парадигмы: включение эффекта ожидания в основной анализ SW-CRTs
  • Методологический прогресс: предоставление теоретической основы и инструментов для последующих исследований
  • Междисциплинарность: связь статистики, эпидемиологии и поведенческих наук

2. Практическая ценность:

  • Дизайн испытания: формулы расчёта объёма выборки могут быть непосредственно использованы при планировании испытания
  • Анализ данных: предоставляет шаблон для вторичного анализа и анализа чувствительности
  • Стандарты отчётности: может повлиять на расширение руководящих принципов CONSORT-SW

3. Воспроизводимость:

  • Программное обеспечение: код R открыт на GitHub
  • Документация: подробное приложение и дополнительные материалы
  • Данные: данные REDAPS доступны по запросу

4. Ограничения:

  • Обобщаемость: требуется проверка в большем количестве областей и дизайнов
  • Барьеры внедрения: увеличенная сложность может ограничить практическое внедрение
  • Потребность в образовании: требуется обучение и тематические исследования для поддержки

Применимые сценарии

Настоятельно рекомендуется:

  1. Ослепление невозможно: политические вмешательства, образовательные программы, организационные изменения
  2. Требуется предварительное уведомление: вмешательства, требующие подготовительного периода или обучения
  3. Результаты чувствительны к поведению: исследования, где результаты зависят от ожиданий и мотивации (например, соответствие, производительность)
  4. Высокий ICC: исследования с сильной внутрикластерной корреляцией

Осторожное использование:

  1. Ослепление возможно: испытания лекарств, оценка диагностических инструментов
  2. Объективные результаты: биомаркеры, смертность и другие результаты, не зависящие от ожиданий
  3. Краткосрочные исследования: когда количество периодов мало (<5), увеличение дисперсии серьёзно
  4. Малые выборки: когда количество кластеров мало, мощность проверки недостаточна

Неприменимо:

  1. Параллельные рандомизированные испытания (без временного чередования)
  2. Индивидуальные рандомизированные испытания (без эффектов кластера)
  3. Сценарии, требующие нелинейных моделей (текущий метод ограничен линейными смешанными моделями)

Избранные ссылки

  1. Hussey MA, Hughes JP (2007). Design and analysis of stepped wedge cluster randomized trials. Contemporary Clinical Trials, 28(2):182-191.
    • Основополагающая статья по SW-CRT
  2. Kenny A, et al. (2022). Analysis of stepped wedge cluster randomized trials in the presence of a time-varying treatment effect. Statistics in Medicine, 41(22):4311-4339.
    • Важная предшествующая работа по гетерогенности времени воздействия
  3. Maleyeff L, et al. (2022). Assessing exposure-time treatment effect heterogeneity in stepped-wedge cluster randomized trials. Biometrics, 79(3):2551-2564.
    • Модель ETI со случайными эффектами
  4. Courtright KR, et al. (2024). Default palliative care consultation for seriously ill hospitalized patients: a pragmatic cluster randomized trial. JAMA, 331(3):224-232.
    • Основные результаты испытания REDAPS
  5. Hemming K, Taljaard M (2020). Reflection on modern methods: when is a stepped-wedge cluster randomized trial a good study design choice? International Journal of Epidemiology, 49(3):1043-1052.
    • Руководство по выбору дизайна SW-CRT

Общая оценка: Это высококачественная методологическая статья, заполняющая важный пробел в анализе SW-CRTs. Теория строгая, эмпирические доказательства достаточны, практическая ценность высока. Основной вклад заключается в систематической количественной оценке влияния эффекта ожидания и предоставлении операционализируемых решений. Ограничения в основном связаны с ограничениями предположений модели и широтой эмпирических доказательств. Рекомендуется осторожное применение на практике, сочетание с экспертным знанием области для оценки вероятности эффекта ожидания и проведение анализа чувствительности.