Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets
Wang, Schröder, Frauen et al.
Constructing confidence intervals (CIs) for the average treatment effect (ATE) from patient records is crucial to assess the effectiveness and safety of drugs. However, patient records typically come from different hospitals, thus raising the question of how multiple observational datasets can be effectively combined for this purpose. In our paper, we propose a new method that estimates the ATE from multiple observational datasets and provides valid CIs. Our method makes little assumptions about the observational datasets and is thus widely applicable in medical practice. The key idea of our method is that we leverage prediction-powered inferences and thereby essentially `shrink' the CIs so that we offer more precise uncertainty quantification as compared to naïve approaches. We further prove the unbiasedness of our method and the validity of our CIs. We confirm our theoretical results through various numerical experiments. Finally, we provide an extension of our method for constructing CIs from combinations of experimental and observational datasets.
academic
Costruzione di Intervalli di Confidenza per gli Effetti Medi del Trattamento da Più Dataset
Questo articolo propone un nuovo metodo per costruire intervalli di confidenza dell'effetto medio del trattamento (ATE) da più dataset osservazionali. Il metodo assume meno ipotesi sui dataset osservazionali e ha ampia applicabilità nella pratica medica. L'idea centrale è utilizzare l'inferenza guidata dalla predizione (prediction-powered inference) per "restringere" gli intervalli di confidenza, fornendo una quantificazione dell'incertezza più precisa rispetto ai metodi ingenui. L'articolo dimostra l'assenza di distorsione del metodo e la validità degli intervalli di confidenza, verificando i risultati teorici attraverso esperimenti numerici. Inoltre, estende il metodo per gestire combinazioni di dataset sperimentali e osservazionali.
Nel settore medico, la costruzione di intervalli di confidenza dell'ATE dai registri dei pazienti è cruciale per valutare l'efficacia e la sicurezza dei farmaci. Tuttavia, i registri dei pazienti provengono tipicamente da ospedali diversi, e come integrare efficacemente più dataset osservazionali diventa una sfida fondamentale.
Esigenze Decisionali Mediche: Intervalli di confidenza affidabili sono essenziali per il processo decisionale medico, garantendo scelte terapeutiche basate su evidenze
Dispersione dei Dati: Le cartelle cliniche elettroniche sono tipicamente distribuite tra diverse istituzioni mediche e paesi, richiedendo integrazione e utilizzo
Caso COVID-19: Durante la pandemia, è stata necessaria una valutazione rapida dell'efficacia dei farmaci da dati multicentrici, come lo studio su nirmatrelvir/ritonavir
Limitazioni della Stima Puntuale: La maggior parte dei metodi multi-dataset si concentra sulla stima puntuale, mancando di quantificazione dell'incertezza
Problemi dell'Approccio Ingenuo:
La concatenazione diretta dei dataset produce stime distorte a causa della distorsione da confondimento
L'utilizzo solo del piccolo dataset ignora le informazioni del grande dataset, producendo intervalli di confidenza eccessivamente conservativi
Limitazioni delle Ipotesi: I metodi esistenti assumono relazioni forti tra i dataset
Dato un piccolo dataset osservazionale imparziale D₁ (che soddisfa l'ipotesi di assenza di confondimento) e un grande dataset osservazionale D₂ (che consente confondimento non osservato), l'obiettivo è stimare l'ATE τ = EY¹(1) - Y¹(0) della popolazione target e costruire un intervallo di confidenza valido.
Fase A: Misura di Adattamento (Measure of Fit)
Stima dell'effetto medio del trattamento condizionato (CATE) su D₂ utilizzando suddivisione campionaria:
Angelopoulos et al. (2023). Prediction-powered inference. Science.
van der Laan et al. (2024). Adaptive-TMLE for average treatment effect. arXiv.
Kallus et al. (2018). Removing hidden confounding by experimental grounding. NeurIPS.
Yang & Ding (2020). Combining multiple observational data sources. JASA.
Valutazione Complessiva: Questo è un articolo di alta qualità nel campo dell'inferenza causale, che applica con successo il framework di inferenza guidata dalla predizione al problema della stima dell'ATE multi-dataset. L'articolo ha fondamenti teorici solidi, design sperimentale razionale e significativo valore pratico nelle applicazioni mediche. Sebbene presenti alcune limitazioni nelle ipotesi, il contributo complessivo è notevole e fornisce nuovi strumenti metodologici al campo dell'inferenza causale.