Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets
Wang, Schröder, Frauen et al.
Constructing confidence intervals (CIs) for the average treatment effect (ATE) from patient records is crucial to assess the effectiveness and safety of drugs. However, patient records typically come from different hospitals, thus raising the question of how multiple observational datasets can be effectively combined for this purpose. In our paper, we propose a new method that estimates the ATE from multiple observational datasets and provides valid CIs. Our method makes little assumptions about the observational datasets and is thus widely applicable in medical practice. The key idea of our method is that we leverage prediction-powered inferences and thereby essentially `shrink' the CIs so that we offer more precise uncertainty quantification as compared to naïve approaches. We further prove the unbiasedness of our method and the validity of our CIs. We confirm our theoretical results through various numerical experiments. Finally, we provide an extension of our method for constructing CIs from combinations of experimental and observational datasets.
academic
Construcción de Intervalos de Confianza para Efectos de Tratamiento Promedio a partir de Múltiples Conjuntos de Datos
Este artículo propone un nuevo método para construir intervalos de confianza del efecto de tratamiento promedio (ATE) a partir de múltiples conjuntos de datos observacionales. El método realiza supuestos menos restrictivos sobre los conjuntos de datos observacionales y posee amplia aplicabilidad en la práctica médica. La idea central es utilizar inferencia impulsada por predicción (prediction-powered inference) para "contraer" los intervalos de confianza, proporcionando una cuantificación de incertidumbre más precisa en comparación con métodos ingenuos. El artículo demuestra la insesgadez del método y la validez de los intervalos de confianza, verificando los resultados teóricos mediante experimentos numéricos. Además, extiende el método para manejar combinaciones de conjuntos de datos experimentales y observacionales.
En el campo médico, la construcción de intervalos de confianza para el ATE a partir de registros de pacientes es crucial para evaluar la eficacia y seguridad de medicamentos. Sin embargo, los registros de pacientes típicamente provienen de diferentes hospitales, y cómo integrar efectivamente múltiples conjuntos de datos observacionales se convierte en un desafío clave.
Necesidades de Decisión Médica: Los intervalos de confianza confiables son críticos para la toma de decisiones médicas, asegurando opciones de tratamiento basadas en evidencia
Dispersión de Datos: Los registros electrónicos de salud típicamente se distribuyen entre diferentes instituciones médicas y países, requiriendo integración y aprovechamiento
Caso COVID-19: Durante la pandemia, fue necesario evaluar rápidamente la eficacia de medicamentos a partir de datos multicéntricos, como en estudios de nirmatrelvir/ritonavir
Limitaciones de Estimación Puntual: La mayoría de métodos de múltiples conjuntos de datos se enfoca en estimación puntual, careciendo de cuantificación de incertidumbre
Problemas de Métodos Ingenuos:
Concatenar directamente conjuntos de datos resulta en estimaciones sesgadas debido a sesgo de confusión
Utilizar solo el conjunto de datos pequeño ignora información del conjunto grande, resultando en intervalos de confianza excesivamente conservadores
Restricciones de Supuestos: Los métodos existentes asumen relaciones fuertes entre conjuntos de datos
Metodología Novedosa: Propone un método de construcción de intervalos de confianza de ATE para múltiples conjuntos de datos basado en inferencia impulsada por predicción
Garantías Teóricas: Demuestra la consistencia de la estimación y la validez de los intervalos de confianza
Amplia Aplicabilidad: Extiende el método a escenarios que combinan RCT con conjuntos de datos observacionales
Verificación Experimental: Valida la efectividad del método mediante datos sintéticos y médicos
Dado un pequeño conjunto de datos observacionales insesgado D₁ (satisfaciendo el supuesto de no confusión) y un gran conjunto de datos observacionales D₂ (permitiendo confusión no observada), el objetivo es estimar el ATE τ = EY¹(1) - Y¹(0) de la población objetivo y construir un intervalo de confianza válido.
Angelopoulos et al. (2023). Prediction-powered inference. Science.
van der Laan et al. (2024). Adaptive-TMLE for average treatment effect. arXiv.
Kallus et al. (2018). Removing hidden confounding by experimental grounding. NeurIPS.
Yang & Ding (2020). Combining multiple observational data sources. JASA.
Evaluación General: Este es un artículo de alta calidad en inferencia causal que extiende exitosamente el marco de inferencia impulsada por predicción al problema de estimación de ATE en múltiples conjuntos de datos. El artículo posee fundamentos teóricos sólidos, diseño experimental razonable y valor práctico importante en aplicaciones médicas. Aunque existen algunas limitaciones de supuestos, las contribuciones generales son significativas, proporcionando nuevas herramientas metodológicas al campo de la inferencia causal.