Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets
Wang, Schröder, Frauen et al.
Constructing confidence intervals (CIs) for the average treatment effect (ATE) from patient records is crucial to assess the effectiveness and safety of drugs. However, patient records typically come from different hospitals, thus raising the question of how multiple observational datasets can be effectively combined for this purpose. In our paper, we propose a new method that estimates the ATE from multiple observational datasets and provides valid CIs. Our method makes little assumptions about the observational datasets and is thus widely applicable in medical practice. The key idea of our method is that we leverage prediction-powered inferences and thereby essentially `shrink' the CIs so that we offer more precise uncertainty quantification as compared to naïve approaches. We further prove the unbiasedness of our method and the validity of our CIs. We confirm our theoretical results through various numerical experiments. Finally, we provide an extension of our method for constructing CIs from combinations of experimental and observational datasets.
academic
Построение доверительных интервалов для средних эффектов лечения из нескольких наборов данных
В данной статье предлагается новый метод построения доверительных интервалов для среднего эффекта лечения (ATE) на основе нескольких наблюдательных наборов данных. Метод предъявляет меньше требований к наблюдательным наборам данных и имеет широкое применение в медицинской практике. Основная идея заключается в использовании предсказательно-управляемого вывода (prediction-powered inference) для "сжатия" доверительных интервалов, обеспечивая более точное количественное определение неопределённости по сравнению с наивными методами. В статье доказана несмещённость метода и корректность доверительных интервалов, результаты подтверждены численными экспериментами. Кроме того, метод расширен для обработки комбинаций экспериментальных и наблюдательных наборов данных.
В медицинской области построение доверительных интервалов для ATE из записей пациентов имеет критическое значение для оценки эффективности и безопасности лекарственных препаратов. Однако записи пациентов обычно поступают из разных больниц, и эффективное объединение нескольких наблюдательных наборов данных становится ключевой задачей.
Потребности медицинских решений: Надёжные доверительные интервалы критически важны для принятия медицинских решений, обеспечивая выбор лечения на основе доказательств
Распределённость данных: Электронные медицинские записи обычно распределены между различными медицинскими учреждениями и странами, требуя интегрированного использования
Пример COVID-19: Во время пандемии требовалась быстрая оценка эффективности лекарств из многоцентровых данных, например, исследования нирматрелвира/ритонавира
Ограничения точечного оценивания: Большинство существующих методов для нескольких наборов данных сосредоточены на точечном оценивании, не обеспечивая количественное определение неопределённости
Проблемы наивных методов:
Прямое объединение наборов данных приводит к смещённым оценкам из-за смешивающих факторов
Использование только малого набора данных игнорирует информацию из большого набора, что приводит к чрезмерно консервативным доверительным интервалам
Ограничения предположений: Существующие методы предъявляют строгие требования к отношениям между наборами данных
Новая методология: Предложен метод построения доверительных интервалов для ATE из нескольких наборов данных на основе предсказательно-управляемого вывода
Теоретические гарантии: Доказана состоятельность оценки и корректность доверительных интервалов
Широкая применимость: Метод расширен на сценарии комбинирования РКИ и наблюдательных наборов данных
Экспериментальная верификация: Эффективность метода подтверждена на синтетических и медицинских данных
Дан малый несмещённый наблюдательный набор данных D₁ (удовлетворяющий предположению об отсутствии смешивания) и большой наблюдательный набор данных D₂ (допускающий ненаблюдаемое смешивание), целью является оценка ATE целевой популяции τ = EY¹(1) - Y¹(0) и построение корректного доверительного интервала.
Angelopoulos et al. (2023). Prediction-powered inference. Science.
van der Laan et al. (2024). Adaptive-TMLE for average treatment effect. arXiv.
Kallus et al. (2018). Removing hidden confounding by experimental grounding. NeurIPS.
Yang & Ding (2020). Combining multiple observational data sources. JASA.
Общая оценка: Это высококачественная статья по причинному выводу, успешно применившая фреймворк предсказательно-управляемого вывода к проблеме оценки ATE из нескольких наборов данных. Статья имеет прочную теоретическую базу, разумный экспериментальный дизайн и значительную практическую ценность в медицинских приложениях. Хотя существуют некоторые ограничения предположений, общий вклад значителен и предоставляет новые методологические инструменты для области причинного вывода.