In stepped wedge cluster randomized trials (SW-CRTs), the intervention is rolled out to clusters over multiple periods. A standard approach for analyzing SW-CRTs utilizes the linear mixed model, where the treatment effect is only present after the treatment adoption, under the assumption of no anticipation. This assumption, however, may not always hold in practice because stakeholders, providers, or individuals who are aware of the treatment adoption timing (especially when blinding is challenging or infeasible) can inadvertently change their behaviors in anticipation of the forthcoming intervention. We provide an analytical framework to address the anticipation effect in SW-CRTs and study its impact. We derive expectations of the estimators based on a collection of linear mixed models and demonstrate that when the anticipation effect is ignored, these estimators give biased estimates of the treatment effect. We also provide updated sample size formulas that explicitly account for anticipation effects, exposure-time heterogeneity, or both in SW-CRTs and illustrate their impact on study power. Through simulation studies and empirical analyses, we compare the treatment effect estimators with and without adjusting for anticipation, and provide some practical considerations.
On Anticipation Effect in Stepped Wedge Cluster Randomized Trials 论文ID : 2504.08158标题 : On Anticipation Effect in Stepped Wedge Cluster Randomized Trials作者 : Hao Wang, Xinyuan Chen, Katherine R. Courtright, Scott D. Halpern, Michael O. Harhay, Monica Taljaard, Fan Li分类 : stat.ME (Statistics - Methodology)发表时间 : 2025年11月14日 (arXiv v2)论文链接 : https://arxiv.org/abs/2504.08158 在阶梯楔形整群随机试验(SW-CRTs)中,干预措施在多个时期内逐步推广到各个集群。标准分析方法使用线性混合模型,假设治疗效应仅在干预实施后出现,且不存在预期效应。然而,这一假设在实践中可能不成立,因为了解干预时间的利益相关者、提供者或个体(特别是在盲法困难或不可行时)可能会因预期即将到来的干预而无意中改变其行为。本文提供了一个分析框架来处理SW-CRTs中的预期效应并研究其影响。作者基于线性混合模型推导了估计量的期望,证明当忽略预期效应时,这些估计量会给出有偏的治疗效应估计。文章还提供了明确考虑预期效应、暴露时间异质性或两者兼具的样本量公式,并说明了它们对研究功效的影响。
阶梯楔形整群随机试验(SW-CRT)是一种特殊的试验设计,其中所有集群最初处于对照条件,然后在多个时期内按随机顺序逐步接受干预。传统分析假设治疗效应仅在干预实施后出现,不存在预期效应 (anticipation effect)。
实践中的普遍性 : 在许多SW-CRT中,盲法具有挑战性或不可行,参与者可能提前知道干预时间行为改变 : 了解即将接受干预的集群成员可能会改变行为,产生预期效应估计偏倚 : 忽略预期效应可能导致治疗效应估计严重偏倚无预期假设 : 几乎所有先前工作都假设不存在预期效应模型错误设定 : 现有文献主要关注暴露时间异质性,未系统研究预期效应样本量计算 : 现有样本量公式未考虑预期效应的影响系统研究预期效应对SW-CRT分析的影响 量化模型错误设定导致的偏倚 为试验设计提供考虑预期效应的样本量计算方法 提供实践指导 理论框架 : 首次系统地为SW-CRT中的预期效应提供分析框架,定义了四种线性混合模型(HH, HH-ANT, ETI, ETI-ANT)偏倚公式 : 推导了16种真实模型与工作模型组合场景下的闭式偏倚公式,量化了忽略预期效应和/或暴露时间异质性的影响方差公式 : 提供了考虑预期效应的治疗效应估计量的方差表达式,用于样本量计算样本量方法 : 开发了明确考虑预期效应、暴露时间异质性或两者的样本量公式实证证据 : 通过模拟研究和REDAPS试验的重新分析,验证了理论结果并提供实践建议软件工具 : 提供R函数(Trt.Ant.Power)用于考虑预期效应的功效分析输入 :
I个集群,J个时期,每个集群-时期有K个个体 结局变量 Y i j k Y_{ijk} Y ijk : 集群i在时期j中个体k的连续结局 治疗指示器 Z i j Z_{ij} Z ij : 集群i在时期j是否接受治疗 预期指示器 A i j A_{ij} A ij : 集群i在时期j是否处于预期期 输出 :
治疗效应估计: θ ^ \hat{\theta} θ ^ (常数效应)或 θ ^ ( s ) \hat{\theta}(s) θ ^ ( s ) (暴露时间s的点治疗效应) 时间平均治疗效应(TATE): Δ = 1 J − 1 ∑ s = 1 J − 1 θ ( s ) \Delta = \frac{1}{J-1}\sum_{s=1}^{J-1}\theta(s) Δ = J − 1 1 ∑ s = 1 J − 1 θ ( s ) 预期效应估计: γ ^ \hat{\gamma} γ ^ 论文定义了四种线性混合模型:
1. HH模型(Hussey-Hughes) - 基线模型,假设常数治疗效应,无预期:
Y i j k = μ + α j + θ Z i j + b i + ϵ i j k Y_{ijk} = \mu + \alpha_j + \theta Z_{ij} + b_i + \epsilon_{ijk} Y ijk = μ + α j + θ Z ij + b i + ϵ ijk
2. HH-ANT模型 - 考虑预期效应的常数治疗效应模型:
Y i j k = μ + α j + γ A i j + θ Z i j + b i + ϵ i j k Y_{ijk} = \mu + \alpha_j + \gamma A_{ij} + \theta Z_{ij} + b_i + \epsilon_{ijk} Y ijk = μ + α j + γ A ij + θ Z ij + b i + ϵ ijk
3. ETI模型(Exposure Time Indicator) - 考虑暴露时间异质性,无预期:
Y i j k = μ + α j + θ ( s i j ) Z i j + b i + ϵ i j k Y_{ijk} = \mu + \alpha_j + \theta(s_{ij})Z_{ij} + b_i + \epsilon_{ijk} Y ijk = μ + α j + θ ( s ij ) Z ij + b i + ϵ ijk
4. ETI-ANT模型 - 同时考虑预期效应和暴露时间异质性:
Y i j k = μ + α j + γ A i j + θ ( s i j ) Z i j + b i + ϵ i j k Y_{ijk} = \mu + \alpha_j + \gamma A_{ij} + \theta(s_{ij})Z_{ij} + b_i + \epsilon_{ijk} Y ijk = μ + α j + γ A ij + θ ( s ij ) Z ij + b i + ϵ ijk
其中:
μ \mu μ : 总体均值α j \alpha_j α j : 时期j的长期趋势参数θ \theta θ 或θ ( s ) \theta(s) θ ( s ) : 治疗效应γ \gamma γ : 预期效应b i ∼ N ( 0 , τ 2 ) b_i \sim N(0,\tau^2) b i ∼ N ( 0 , τ 2 ) : 集群随机效应ϵ i j k ∼ N ( 0 , σ 2 ) \epsilon_{ijk} \sim N(0,\sigma^2) ϵ ijk ∼ N ( 0 , σ 2 ) : 残差预期指示器定义 :
A i j = { 1 , j ∗ − l ≤ j < j ∗ 0 , otherwise A_{ij} = \begin{cases} 1, & j^* - l \leq j < j^* \\ 0, & \text{otherwise} \end{cases} A ij = { 1 , 0 , j ∗ − l ≤ j < j ∗ otherwise
其中j ∗ j^* j ∗ 是治疗采纳时期,l l l 是预期效应的阶数(本文主要考虑l = 1 l=1 l = 1 )。
1. 系统的模型错误设定分析
论文穷举了16种真实模型与工作模型的组合(表2),分类为:
正确设定 (4种): 工作模型与真实模型一致过度设定 (5种): 工作模型包含不必要的参数欠设定 (5种): 工作模型缺少重要参数不匹配 (2种): 工作模型错误设定参数结构2. 偏倚公式推导
对于标准SW-CRT设计,论文推导了关键场景的偏倚公式:
定理1 (真实模型HH-ANT,工作模型HH):
E ( θ ^ H H ) = θ H H − A N T + ω H H H H − A N T γ H H − A N T E(\hat{\theta}_{HH}) = \theta^{HH-ANT} + \omega_{HH}^{HH-ANT}\gamma^{HH-ANT} E ( θ ^ HH ) = θ HH − A NT + ω HH HH − A NT γ HH − A NT
其中权重:
ω H H H H − A N T = − 6 ( 1 + ϕ Q ) ( Q + 1 ) ( 2 + ϕ Q ) \omega_{HH}^{HH-ANT} = -\frac{6(1+\phi Q)}{(Q+1)(2+\phi Q)} ω HH HH − A NT = − ( Q + 1 ) ( 2 + ϕQ ) 6 ( 1 + ϕQ )
这表明忽略预期效应会导致有偏估计,偏倚方向取决于预期效应的符号。
定理2 (真实模型ETI-ANT,工作模型HH):
E ( θ ^ H H ) = ∑ j = 1 J − 1 { π H H E T I − A N T ( j ) θ E T I − A N T ( j ) + ω H H E T I − A N T ( j ) γ E T I − A N T } E(\hat{\theta}_{HH}) = \sum_{j=1}^{J-1}\left\{\pi_{HH}^{ETI-ANT}(j)\theta^{ETI-ANT}(j) + \omega_{HH}^{ETI-ANT}(j)\gamma^{ETI-ANT}\right\} E ( θ ^ HH ) = ∑ j = 1 J − 1 { π HH ET I − A NT ( j ) θ ET I − A NT ( j ) + ω HH ET I − A NT ( j ) γ ET I − A NT }
关键发现:某些权重π H H E T I − A N T ( j ) \pi_{HH}^{ETI-ANT}(j) π HH ET I − A NT ( j ) 可能为负,导致估计量可能与真实TATE符号相反。
3. 方差公式
定理7 : 对于一般SW-CRT,提供了四种模型的方差表达式:
HH-ANT模型:
V ( θ ^ H H − A N T ) = I J ρ 1 ρ 2 σ t 2 K { ρ 2 ( U 2 + I J U − J W 1 − I W 2 − J W 5 2 I 2 − W 3 ) + ρ 1 ( I W 2 − U 2 ) } − 1 V(\hat{\theta}_{HH-ANT}) = \frac{IJ\rho_1\rho_2\sigma_t^2}{K}\left\{\rho_2(U^2+IJU-JW_1-IW_2-\frac{JW_5^2}{I^2}-W_3) + \rho_1(IW_2-U^2)\right\}^{-1} V ( θ ^ HH − A NT ) = K I J ρ 1 ρ 2 σ t 2 { ρ 2 ( U 2 + I J U − J W 1 − I W 2 − I 2 J W 5 2 − W 3 ) + ρ 1 ( I W 2 − U 2 ) } − 1
其中设计常数依赖于治疗分配和预期指示器。
重要发现 :
V ( θ ^ H H ) < V ( θ ^ H H − A N T ) V(\hat{\theta}_{HH}) < V(\hat{\theta}_{HH-ANT}) V ( θ ^ HH ) < V ( θ ^ HH − A NT ) 方差膨胀随ICC增大和时期数减少而增加 对于J=9时期,方差膨胀可达40-50% 4. 样本量和功效计算
基于方差公式,提供了双侧Wald检验的功效公式:
Power = Φ { ∣ θ ∗ ∣ V ( θ ^ ) − z 1 − α / 2 } \text{Power} = \Phi\left\{\frac{|\theta^*|}{\sqrt{V(\hat{\theta})}} - z_{1-\alpha/2}\right\} Power = Φ { V ( θ ^ ) ∣ θ ∗ ∣ − z 1 − α /2 }
但需注意:当工作模型错误设定时,θ ^ \hat{\theta} θ ^ 收敛到有偏值而非真实治疗效应,导致I型错误膨胀。
标准SW-CRT设置 :
I = 32个集群 J = 9个时期(Q = 8个治疗序列) K = 100个个体/集群-时期 ICC: ρ = τ 2 / ( τ 2 + σ 2 ) ≈ 0.0195 \rho = \tau^2/(\tau^2+\sigma^2) \approx 0.0195 ρ = τ 2 / ( τ 2 + σ 2 ) ≈ 0.0195 (τ 2 = 0.141 2 \tau^2=0.141^2 τ 2 = 0.14 1 2 , σ 2 = 1 \sigma^2=1 σ 2 = 1 ) 时期效应: α j = j \alpha_j = j α j = j 2000次模拟重复 四个模拟研究 :
研究I : 真实模型HH (θ = 0 \theta=0 θ = 0 或0.075 0.075 0.075 ),工作模型HH和HH-ANT研究II : 真实模型HH-ANT (θ = 0.075 \theta=0.075 θ = 0.075 , γ = 0.04 \gamma=0.04 γ = 0.04 ),工作模型HH/HH-ANT/ETI/ETI-ANT研究III : 真实模型ETI (正弦函数),工作模型HH/HH-ANT/ETI/ETI-ANT研究IV : 真实模型ETI-ANT (正弦函数+预期),工作模型HH/HH-ANT/ETI/ETI-ANT暴露时间异质性函数 :
θ E T I ( s ) = − 1.41 sin { 2 π ( s − 1 ) / 7 } + 0.12 \theta^{ETI}(s) = -1.41\sin\{2\pi(s-1)/7\} + 0.12 θ ET I ( s ) = − 1.41 sin { 2 π ( s − 1 ) /7 } + 0.12
TATE = 0.12
试验背景 :
名称 : Randomized Evaluation of Default Access to Palliative Services设计 : 11个医院(集群),12个时期,32个月干预 : 默认姑息治疗咨询 vs 常规护理结局 : 患者咨询时间(天数)样本量 : 6,811名患者预期效应可能性 :
临床医生未盲(保留取消默认订单的能力) 干预前3个月的教育准备 干预前2周的通知和沟通 偏倚 : Bias = E ( θ ^ ) − θ \text{Bias} = E(\hat{\theta}) - \theta Bias = E ( θ ^ ) − θ 经验标准差 : Monte Carlo标准差模型标准误 : 平均模型基础标准误覆盖率 : 95%置信区间的经验覆盖百分比功效 : 拒绝H 0 : θ = 0 H_0: \theta=0 H 0 : θ = 0 的百分比(显著性水平0.05)表3结果 :
真实模型 工作模型 θ \theta θ θ ^ \hat{\theta} θ ^ sd(θ ^ \hat{\theta} θ ^ ) se(θ ^ \hat{\theta} θ ^ ) 覆盖率(%) 功效(%) HH HH 0 0.0001 0.0201 0.0203 95.50 4.50 HH HH-ANT 0 0.0000 0.0239 0.0240 95.55 4.45 HH HH 0.075 0.0751 0.0201 0.0203 95.50 96.25 HH HH-ANT 0.075 0.0750 0.0239 0.0240 95.55 88.15
关键发现 :
两种模型均无偏 HH模型标准误更小(0.0203 vs 0.0240),效率更高 HH模型功效更高(96.25% vs 88.15%) 不必要地调整预期效应导致约19%的方差膨胀 表3结果 (θ = 0.075 \theta=0.075 θ = 0.075 , γ = 0.04 \gamma=0.04 γ = 0.04 ):
工作模型 θ ^ \hat{\theta} θ ^ γ ^ \hat{\gamma} γ ^ 覆盖率(θ \theta θ ) 功效(θ \theta θ ) 覆盖率(γ \gamma γ ) 功效(γ \gamma γ ) HH 0.0521 - 79.85% 73.35% - - HH-ANT 0.0750 0.0399 95.55% 88.15% 94.60% 42.75% ETI 0.0318 - 73.85% 15.85% - - ETI-ANT 0.0756 0.0400 95.45% 42.75% 94.45% 34.80%
关键发现 :
严重低估 : HH模型估计0.0521(真值0.075),相对偏倚-31%不匹配更糟 : ETI模型估计0.0318,相对偏倚-58%,验证了理论预测正确模型 : HH-ANT和ETI-ANT均无偏,维持名义覆盖率效率 : HH-ANT比ETI-ANT更高效(se: 0.0240 vs 0.0426)表4结果 (正弦函数,Δ = 0.12 \Delta=0.12 Δ = 0.12 ):
工作模型 Δ ^ \hat{\Delta} Δ ^ γ ^ \hat{\gamma} γ ^ 覆盖率 功效 HH -0.8480 - 0.00% 100.00% HH-ANT -1.1072 -0.4302 0.00% 100.00% ETI 0.1206 - 94.65% 95.75% ETI-ANT 0.1206 0.0000 95.45% 80.75%
关键发现 :
符号反转 : HH和HH-ANT给出负估计(真值正),覆盖率0%不匹配恶化 : HH-ANT(-1.1072)比HH(-0.8480)偏倚更严重正确模型 : ETI和ETI-ANT无偏预期估计 : HH-ANT错误估计γ = − 0.4302 \gamma=-0.4302 γ = − 0.4302 (真值0),验证了负权重理论表4结果 (正弦函数+预期,Δ = 0.12 \Delta=0.12 Δ = 0.12 ,γ = 0.04 \gamma=0.04 γ = 0.04 ):
工作模型 Δ ^ \hat{\Delta} Δ ^ γ ^ \hat{\gamma} γ ^ 覆盖率(Δ \Delta Δ ) 功效(Δ \Delta Δ ) HH -0.8721 - 0.00% 100.00% HH-ANT -1.1072 -0.3902 0.00% 100.00% ETI 0.0768 - 73.85% 66.50% ETI-ANT 0.1206 0.0400 95.45% 80.75%
关键发现 :
双重错误设定 : HH和HH-ANT严重偏倚预期符号反转 : HH-ANT估计γ = − 0.3902 \gamma=-0.3902 γ = − 0.3902 (真值+0.04)单一错误 : ETI低估(0.0768 vs 0.12),相对偏倚-36%正确模型 : 仅ETI-ANT无偏且覆盖率正确似然比检验 :
ETI模型检验暴露时间异质性: p=0.15 ETI-ANT模型检验暴露时间异质性: p=0.36 结论 : 无强证据支持暴露时间异质性,聚焦HH和HH-ANT治疗效应估计 :
HH模型: θ ^ = − 1.23 \hat{\theta}=-1.23 θ ^ = − 1.23 (95% CI: -1.52 to -0.93) HH-ANT模型: θ ^ = − 1.43 \hat{\theta}=-1.43 θ ^ = − 1.43 (95% CI: -1.76 to -1.10) 差异 : HH-ANT估计的绝对效应更大(减少咨询时间1.43天 vs 1.23天)预期效应估计 :
HH-ANT模型: γ ^ = − 0.59 \hat{\gamma}=-0.59 γ ^ = − 0.59 (95% CI: -1.01 to -0.17),统计显著 解释 : 干预前咨询时间减少0.59天,表明临床医生在正式实施前已调整行为实践意义 :
忽略负预期效应导致治疗效应低估约14% (1.23 vs 1.43) 教育准备产生了提前收益 正式实施后效应进一步增强 方差膨胀 (图6):
J=5时期: 方差膨胀40-90%(取决于ICC) J=9时期: 方差膨胀40-50% J=33时期: 方差膨胀仅10%(当ρ > 0.02 \rho>0.02 ρ > 0.02 ) 相对功效 (Web图3-7):
取决于γ / θ \gamma/\theta γ / θ 比率和ICC J=5,θ = 0.1 \theta=0.1 θ = 0.1 : 当γ / θ > 0.295 \gamma/\theta>0.295 γ / θ > 0.295 时HH-ANT功效更高 绝对功效差异随J减小和ρ \rho ρ 增大而增加 Hussey & Hughes (2007) : 提出随机截距模型(HH模型)Hughes et al. (2015) : 首次提出延迟、线性和非线性治疗效应结构Nickless et al. (2018) : 提出ETI模型处理暴露时间累积效应Kenny et al. (2022) : 证明常数治疗效应假设下的严重偏倚,可能符号相反Maleyeff et al. (2022) : 提出ETI随机效应模型和置换检验Lee et al. (2025) : 区分暴露时间与日历时间效应Wang et al. (2024) : 证明线性混合模型对协变量、随机效应和误差结构错误设定稳健,但对治疗效应结构要求严格Chen & Li (2025) : 提出日历时间变化效应和信息性集群大小的估计方程首次系统研究 : 预期效应在SW-CRT中的影响填补空白 : 现有文献几乎完全忽视预期效应综合考虑 : 同时处理预期效应和暴露时间异质性实用工具 : 提供样本量计算方法和软件1. 模型选择指导 :
无异质性 : HH模型最有效仅预期效应 : HH-ANT模型无偏但方差膨胀10-90%仅暴露时间异质性 : ETI模型无偏两者兼有 : ETI-ANT模型必需2. 偏倚模式 :
忽略预期效应导致治疗效应衰减或放大(取决于γ \gamma γ 符号) 不匹配场景(HH-ANT当真实为ETI)比欠设定(HH)更糟 负权重可能导致估计符号反转 3. 试验设计 :
考虑预期效应导致显著样本量增加 仅当预期效应高度可能时才在设计阶段调整 盲法和延迟通知是首选策略 1. 模型假设 :
仅考虑暴露时间效应,未涉及日历时间效应 假设简单可交换相关结构 聚焦连续结局,二元和计数结局需扩展 2. 预期效应结构 :
主要考虑一阶预期(l = 1 l=1 l = 1 ) 假设常数预期效应,未考虑预期时间异质性 未提供预期阶数的假设检验方法 3. 分析限制 :
正确设定相关结构的假设 未考虑同时错误设定治疗效应和相关结构 功效比较限于特定参数设置 1. 方法扩展 :
开发预期阶数和预期时间异质性的检验方法 扩展到广义线性混合模型(二元、计数结局) 研究更复杂的相关结构(嵌套可交换、离散时间衰减) 2. 设计优化 :
考虑实施期的不完全设计以减少预期影响 优化治疗序列分配以最小化预期偏倚 开发适应性设计方法 3. 因果推断 :
在潜在结局框架下重新定义估计量 区分预期效应和真实治疗效应的因果路径 敏感性分析方法 4. 实践应用 :
系统综述SW-CRT中预期效应的经验证据 开发预期效应可能性的评估工具 制定报告指南 1. 理论贡献 :
系统性 : 首次穷举16种模型组合场景,提供完整理论框架严谨性 : 推导了闭式偏倚和方差公式,数学推导详尽(50页附录)创新性 : 发现不匹配场景可能比欠设定更糟,挑战传统认知2. 方法学价值 :
可操作性 : 提供R软件包和样本量计算函数实用性 : 基于标准线性混合模型,易于实施通用性 : 框架可扩展到其他设计(不完全SW-CRT)3. 实证支持 :
模拟充分 : 4个模拟研究覆盖关键场景,每个2000次重复真实数据 : REDAPS试验分析提供令人信服的实证证据可视化 : 20+图表清晰展示偏倚模式和权重函数4. 写作质量 :
结构清晰,从动机到理论到应用逻辑严密 技术细节与直观解释平衡得当 表2提供了优秀的研究路线图 1. 方法限制 :
相关结构 : 仅考虑可交换结构,实践中可能不现实连续结局 : 二元结局(如死亡率)无闭式解,限制适用性标准设计 : 主要结果基于标准SW-CRT,不等分配和不规则设计需进一步研究2. 实证不足 :
单一案例 : 仅一个真实数据应用,需更多经验证据预期检测 : 未提供检测预期效应存在性的统计检验敏感性分析 : 未充分探讨对ICC和预期效应大小错误设定的敏感性3. 实践指导 :
决策规则 : 缺乏何时应在设计阶段考虑预期效应的明确标准成本收益 : 未讨论方差膨胀与偏倚减少的权衡盲法策略 : 对如何在实践中避免预期效应的建议较少4. 理论空白 :
因果框架 : 未在潜在结局框架下形式化预期效应时间依赖 : 未考虑预期效应随时间变化交互作用 : 未探讨预期效应与个体特征的交互1. 学术影响 :
范式转变 : 将预期效应纳入SW-CRT主流分析框架方法学进展 : 为后续研究提供理论基础和工具跨学科 : 连接统计学、流行病学和行为科学2. 实践价值 :
试验设计 : 样本量公式可直接用于试验规划数据分析 : 提供次要分析和敏感性分析的模板报告标准 : 可能影响CONSORT-SW扩展指南3. 可复现性 :
软件 : R代码公开在GitHub文档 : 详尽的附录和补充材料数据 : REDAPS数据可申请访问4. 局限 :
推广性 : 需在更多领域和设计中验证采纳障碍 : 增加的复杂性可能限制实践采用教育需求 : 需要培训和案例研究支持高度推荐 :
盲法不可行 : 政策干预、教育项目、组织变革提前通知 : 需要准备期或培训的干预行为敏感 : 结局受期望和动机影响(如依从性、绩效)高ICC : 集群内相关性强的研究谨慎使用 :
盲法可行 : 药物试验、诊断工具评估客观结局 : 生物标志物、死亡率等不受期望影响短期研究 : 时期数少(<5)时方差膨胀严重小样本 : 集群数少时检验功效不足不适用 :
平行臂随机试验(无时间交错) 个体随机试验(无集群效应) 非线性模型需要的场景(目前方法限于线性混合模型) Hussey MA, Hughes JP (2007) . Design and analysis of stepped wedge cluster randomized trials. Contemporary Clinical Trials , 28(2):182-191.Kenny A, et al. (2022) . Analysis of stepped wedge cluster randomized trials in the presence of a time-varying treatment effect. Statistics in Medicine , 41(22):4311-4339.Maleyeff L, et al. (2022) . Assessing exposure-time treatment effect heterogeneity in stepped-wedge cluster randomized trials. Biometrics , 79(3):2551-2564.Courtright KR, et al. (2024) . Default palliative care consultation for seriously ill hospitalized patients: a pragmatic cluster randomized trial. JAMA , 331(3):224-232.Hemming K, Taljaard M (2020) . Reflection on modern methods: when is a stepped-wedge cluster randomized trial a good study design choice? International Journal of Epidemiology , 49(3):1043-1052.总体评价 : 这是一篇高质量的方法学论文,填补了SW-CRT分析中的重要空白。理论严谨,实证充分,实践价值高。主要贡献在于系统量化了预期效应的影响并提供了可操作的解决方案。局限主要在于模型假设的限制性和实证证据的广度。建议在实践中谨慎应用,结合领域知识判断预期效应的可能性,并进行敏感性分析。