2025-11-11T07:10:11.815577

"Within-trial" prognostic score adjustment is targeted maximum likelihood estimation

HÃ¸jbjerre-Frandsen, Schuler

Adjustment for ``super'' or ``prognostic'' composite covariates has become more popular in randomized trials recently. These prognostic covariates are often constructed from historical data by fitting a predictive model of the outcome on the raw covariates. A natural question that we have been asked by applied researchers is whether this can be done without the historical data: can the prognostic covariate be constructed or derived from the trial data itself, possibly using different folds of the data, before adjusting for it? Here we clarify that such ``within-trial'' prognostic adjustment is nothing more than a form of targeted maximum likelihood estimation (TMLE), a well-studied procedure for optimal inference. We demonstrate the equivalence with a simulation study and discuss the pros and cons of within-trial prognostic adjustment (standard efficient estimation) relative to standard TMLE and standard prognostic adjustment with historical data.

academic

"Within-trial" prognostic score adjustment is targeted maximum likelihood estimation

基本信息

论文ID: 2507.23446
标题: "Within-trial" prognostic score adjustment is targeted maximum likelihood estimation
作者: Emilie Højbjerre-Frandsen, Alejandro Schuler
分类: stat.ME (Statistics - Methodology)
发表时间: November 6, 2025 (arXiv预印本)
论文链接: https://arxiv.org/abs/2507.23446v2

摘要

近年来，在随机试验中调整"超级"或"预后"复合协变量变得越来越流行。这些预后协变量通常通过在原始协变量上拟合结果的预测模型从历史数据中构建。应用研究人员经常询问的一个自然问题是：这是否可以在没有历史数据的情况下完成——预后协变量是否可以从试验数据本身构建或派生，可能使用数据的不同折叠，然后进行调整？本文澄清了这种"试验内"预后调整不过是目标最大似然估计(TMLE)的一种形式，这是一个经过充分研究的最优推断程序。作者通过仿真研究证明了等价性，并讨论了试验内预后调整相对于标准TMLE和使用历史数据的标准预后调整的优缺点。

研究背景与动机

问题背景

预后协变量调整的兴起：在随机临床试验(RCT)中，使用"超级协变量"或"预后协变量"进行协变量调整已成为提高统计效率的流行方法。这一思想可追溯至Tukey(1993)，旨在利用历史数据开发单一预后协变量，在降低过拟合风险的同时提高效率。
历史数据依赖性问题：传统的预后评分调整方法(如PROCOVA™方法)依赖于来自先前临床试验或注册研究的历史数据。然而，在实际应用中，研究人员经常面临历史数据不可用或不可信的情况。
试验内调整的需求：应用研究人员自然会询问：是否可以在不使用历史数据的情况下构建预后协变量？能否直接从试验数据本身(可能使用交叉验证等技术)派生预后协变量，然后进行调整？

研究动机

本研究的核心动机是澄清"试验内"预后评分调整的本质，并揭示其与已有统计方法的关系，避免"重新发明轮子"。

核心贡献

理论等价性证明：首次明确证明了试验内预后评分调整本质上就是目标最大似然估计(TMLE)的一种形式。
方法论澄清：澄清了试验内预后调整不是一个新方法，而是TMLE在特定子模型下的实现，因此应该直接称为TMLE而非重新命名。
比较分析：系统比较了试验内预后调整、标准TMLE和基于历史数据的标准预后调整方法的优缺点。
实证验证：通过仿真研究验证了理论等价性，并展示了不同方法在各种场景下的表现。

方法详解

任务定义

在两臂随机试验中估计平均治疗效应(ATE)：

输入：n个参与者的观测数据 $O_i = (W_i, A_i, Y_i)$
输出：因果平均治疗效应 $\Psi^* = E[Y(1) - Y(0)]$
约束：简单随机化假设，治疗分配概率已知

其中：

$Y$ ：连续主要终点变量
$W$ ：p维基线协变量向量
$A$ ：治疗指示器(1表示新治疗，0表示对照)

核心方法架构

1. ANCOVA估计器(插值方法)

采用G-computation的表述形式：

使用MLE估计条件均值函数 $\mu(a,w) = E[Y|A=a,W=w]$
提取反事实预测： $\hat{\Psi}_a = \frac{1}{n}\sum_{i=1}^n \hat{\mu}(a,W_i)$
获得ATE估计： $\hat{\Psi} = \hat{\Psi}_1 - \hat{\Psi}_0$
使用影响函数计算渐近方差

2. 预后评分调整

定义预后评分为： $\rho_D(W,A) := E[Y|W,A,D]$

其中D表示数据来源(D=1为新试验，D=0为历史数据)。

标准预后调整流程：

使用历史数据训练预后模型 $\hat{\rho}_0(W,A)$
将预后预测作为额外协变量加入ANCOVA分析
在同质治疗效应假设下达到效率性

3. TMLE方法

TMLE通过以下步骤解决机器学习模型的偏差问题：

初始估计：使用机器学习方法获得初始条件均值估计 $\hat{\mu}$
目标子模型：在参数模型族中进行MLE更新 $\{p_\epsilon(Y|A,W) \sim N(\hat{\mu}(A,W) + \epsilon A_{\pm}, 1) : \epsilon \in \mathbb{R}\}$ 其中 $A_{\pm} = 2A - 1$
更新步骤：找到MLE解 $\epsilon^*$ ，更新预测函数 $\hat{\mu}^*(a,w) = \hat{\mu}(a,w) + \epsilon^* a_{\pm}$
去偏条件：更新后的模型满足 $E[\hat{\mu}^*(1,W) - \hat{\mu}^*(0,W)] = \tilde{\Psi}$ 其中 $\tilde{\Psi}$ 是未调整的效应估计

关键理论结果：等价性证明

定理：试验内预后评分调整等价于使用特定子模型的TMLE。

证明思路：

试验内预后调整使用回归模型： $Y = \beta_1 A_{\pm} + \beta_2 \hat{\mu}(A,W) + X\beta_3 + N(0,1)$
这正是TMLE的一个有效目标子模型，满足：
- 条件1： $\beta = (0,1,0)$ 时恢复初始回归
- 条件2：对 $\beta_1$ 的导数给出去偏方向 $A_{\pm}(Y - \hat{\mu}(A,W))$
因此试验内预后调整的ANCOVA步骤精确对应TMLE更新步骤