Updating $\textit{a priori}$ information given some observed data is the core tenet of Bayesian inference. Bayesian transfer learning extends this idea by incorporating information from a related dataset to improve the inference on the observed target dataset which may have been collected under slightly different settings. The use of related information can be useful when the target dataset is scarce, for example. There exist various Bayesian transfer learning methods that decide how to incorporate the related data in different ways. Unfortunately, there is no principled approach for comparing Bayesian transfer methods in real data settings. Additionally, some Bayesian transfer learning methods, such as the so-called power prior approaches, rely on conjugacy or costly specialised techniques. In this paper, we find an effective approach to compare Bayesian transfer learning methods is to apply leave-one-out cross validation on the target dataset. Further, we introduce a new framework, $\textit{transfer sequential Monte Carlo}$, that efficiently implements power prior methods in an automated fashion. We demonstrate the performance of our proposed methods in two comprehensive simulation studies.
- ID статьи: 2502.19796
- Название: A Principled Approach to Bayesian Transfer Learning
- Авторы: Adam Bretherton, Joshua J. Bon, David J. Warne, Kerrie Mengersen, Christopher Drovandi
- Классификация: stat.ME (Статистика - Методология), stat.CO (Статистика - Вычисления)
- Дата публикации: 14 октября 2025 г. (arXiv v3)
- Ссылка на статью: https://arxiv.org/abs/2502.19796v3
В данной работе исследуется принципиальный подход к байесовскому трансфертному обучению. Суть байесовского вывода заключается в обновлении априорной информации на основе наблюдаемых данных, а байесовское трансфертное обучение расширяет эту идею путём интеграции информации из связанных наборов данных для улучшения вывода на целевом наборе данных. Использование связанной информации особенно ценно, когда целевой набор данных ограничен. Существующие методы байесовского трансфертного обучения применяют различные стратегии интеграции связанных данных, но им не хватает принципиального подхода к сравнению этих методов в условиях реальных данных. Кроме того, некоторые методы (например, метод power prior) зависят от сопряжённости или дорогостоящих специализированных техник. В работе показано, что перекрёстная проверка методом исключения одного наблюдения (LOO-CV) является эффективным способом сравнения методов байесовского трансфертного обучения, и предложена структура трансфертного последовательного метода Монте-Карло (TSMC), позволяющая автоматизировать эффективную реализацию метода power prior.
Байесовское трансфертное обучение направлено на решение проблемы эффективного использования связанных исходных данных для улучшения вывода на целевых данных. В практических приложениях целевые данные часто ограничены и дорогостоящи, тогда как связанные исторические данные или данные из аналогичных исследований могут быть обильными, но отличаться от целевых данных.
- Дефицит данных: В эпидемиологии, клинических испытаниях и других областях получение новых данных дорого и требует времени
- Эффективность использования информации: Полное отбрасывание связанных исходных данных неэффективно, но прямое объединение может привести к смещению
- Практические требования: Необходимо принимать обоснованные решения о трансфере при различных степенях сходства данных
- Отсутствие стандартов сравнения: Нет принципиального метода сравнения производительности различных методов трансфертного обучения в условиях реальных данных
- Вычислительная сложность: Метод power prior зависит от сопряжённых априорных распределений или специализированных техник MCMC с высокой вычислительной стоимостью
- Сложность выбора параметров: Фиксированный power prior требует поиска по сетке, а нормализованный power prior имеет проблему двойной неразрешимости
Данная работа направлена на предоставление единой структуры для:
- Установления принципиальных стандартов сравнения методов байесовского трансфертного обучения
- Разработки вычислительно эффективного метода реализации power prior
- Оценки производительности методов без знания истинных значений параметров
- Предложена структура апостериорной предсказательной проверки: Использование перекрёстной проверки методом исключения одного наблюдения (LOO-CV) как принципиального стандарта для сравнения методов байесовского трансфертного обучения в условиях реальных данных
- Разработана вычислительная структура TSMC: Предложен метод трансфертного последовательного метода Монте-Карло, позволяющий одновременно эффективно реализовать фиксированный power prior (FPP) и нормализованный power prior (NPP)
- Решена проблема двойной неразрешимости: Преодолены вычислительные трудности, связанные с зависимостью параметров от нормализующей константы в NPP, посредством умной стратегии разложения
- Обеспечена систематическая оценка: Эффективность предложенных методов проверена в двух комплексных имитационных исследованиях
Дан целевой набор данных yT (размер n) и связанный исходный набор данных yS (размер m, где n<m). Цель состоит в использовании исходных данных для улучшения байесовского вывода на целевых данных, избегая при этом негативного влияния различий между исходными и целевыми данными.
Power prior регулирует влияние исходных данных через параметр α∈(0,1):
π(θ∣yS,α)=CS(α)p(yS∣θ)απ(θ)
где CS(α) — нормализующая константа. Целевое апостериорное распределение:
π(θ∣yT,yS,α)=CT,S(α)p(yT∣θ)p(yS∣θ)απ(θ)
- Фиксированный Power Prior (FPP): α — фиксированное значение, определяемое критериями выбора модели
- Нормализованный Power Prior (NPP): α — случайная величина с априорным распределением α∼Beta(α0,β0)
Использование соотношения разложения CT(α)=CS(α)CT,S(α) для косвенной оценки нормализующей константы, избегая прямых вычислений.
Расписание 1: Оценка CS(α)
- Целевое распределение: πt,S(θ∣yS,αt)∝p(yS∣θ)αtπ(θ)
- Последовательность обратных температур: 0=α0<α1<⋯<αT=1
Расписание 2: Оценка CT,S(α)
- Целевое распределение: πt,TSMC(θ∣yS,yT,γt,αt)∝p(yT∣θ)γtp(yS∣θ)αtπ(θ)
- Двухэтапная конструкция: сначала интегрируются целевые данные через γ, затем исходные данные через α
TSMC-ME (свидетельство модели):
α∗=argmaxα∈[0,1]CT(α)
TSMC-NPP (полностью байесовский подход):
π(α∣yT,yS)∝CT(α)π(α)
- Смещение: Bias=∣μ^θ−θ∗∣
- Среднеквадратическая ошибка: MSE=N1∑i=1N(θi−θ∗)2
- Частотная вероятность покрытия: FCP0.9
Условная логарифмическая поточечная плотность предсказания (CLPPD):
CLPPD=∑i=1nlog(N1∑j=1Np(yT,i∣θj))
Перекрёстная проверка методом исключения одного наблюдения (LOO-CV):
LOO-CV=∑i=1nlog(N1∑j=1Np(yT,i∣θ(−i,j)))
Ускоренное вычисление через важность выборки:
W−i(j)=∑k=1Nw−i(k)w−i(j),w−i(j)=p(yT,i∣θj)−1
- Модель: y=β0+xβ1+ϵ, ϵ∼N(0,σ2)
- Установка параметров: θT=(5,3,2), θS=θT+2k⋅s^
- Размер данных: целевые данные n=40, исходные данные m=80
- Уровни различия: k∈{0,1,2,3}
- Контекст: На основе клинических испытаний меланомы E1684 и E1690
- Модель: Модель излечения Вейбулла с ковариатами
- Размерность параметров: 7-мерный вектор параметров
- Размер данных: целевые данные n=40, исходные данные m=300
- Идеальные показатели: смещение, MSE, вероятность покрытия 90%
- Практические показатели: CLPPD, LOO-CV и их ранжирование
- Сравниваемые методы: отдельный вывод на целевых данных (BT), отдельный вывод на исходных данных (BS), байесовское обновление (BU), FPP, NPP, вывод на истинных данных (True)
- Количество частиц: N=1000
- Порог эффективного размера выборки: E=N/2=500
- Количество повторений: 100 независимых экспериментов для каждой установки
- Установка априорного распределения: α∼Beta(1,1)
Из таблицы 1 видно:
- k=0 (без различий): методы BU и True показывают лучшую производительность, LOO-CV правильно идентифицирует оптимальный метод
- k=1 (незначительные различия): методы FPP и NPP начинают показывать преимущества, LOO-CV точно ранжирует методы
- k=2,3 (средние/серьёзные различия): методы целевых данных постепенно становятся лучше, методы power prior остаются конкурентоспособными
Ключевые находки:
- LOO-CV правильно идентифицирует лучший метод при всех уровнях различия
- CLPPD систематически отдаёт предпочтение методам целевых данных, даже превосходя истинный метод
Таблица 2 показывает согласованные результаты в более сложной модели:
- Из-за ограниченного информационного содержания данных и большего размера исходных данных методы целевых данных показывают относительно худшую производительность
- LOO-CV по-прежнему точно идентифицирует оптимальную стратегию трансфера
- Проблема смещения CLPPD становится более явной
- Преимущества LOO-CV: избегает переобучения, высокая согласованность с ранжированием идеальных показателей
- Проблемы CLPPD: оценка на обучающих данных приводит к предпочтению методов целевых данных
- Показывают лучшую производительность при средних различиях
- Адаптивно регулируют влияние исходных данных
- Структура TSMC делает вычисления осуществимыми
- Структура TSMC избегает повторных вычислений путём сохранения промежуточных результатов
- Выборка по важности делает вычисление LOO-CV эффективным
- Одиночный запуск одновременно получает результаты FPP и NPP
- Семейство Power Prior: классический метод, предложенный Ibrahim et al. (2003, 2015)
- Commensurate Prior: Hobbs et al. (2011), использующий spike-and-slab априорные распределения
- Подход Meta-Analytic-Predictive (MAPA): Neuenschwander et al. (2010)
- Методы сопряжённых априорных распределений: Carvalho and Ibrahim (2021)
- MCMC с двойной неразрешимостью: Park and Haran (2018)
- Последовательный метод Монте-Карло: Chopin (2002), Del Moral et al. (2006)
- Информационные критерии: традиционные методы DIC, WAIC и т.д.
- Перекрёстная проверка: менее часто применяется в байесовском трансфертном обучении
- LOO-CV — эффективный стандарт оценки: Может точно идентифицировать оптимальную стратегию трансфера без знания истинных параметров
- Структура TSMC решает вычислительные проблемы: Делает метод power prior практически применимым
- Ценность умеренного трансфера: Методы power prior значительно превосходят экстремальные стратегии, когда исходные и целевые данные умеренно связаны
- Ограничение на единственный исходный набор данных: Текущая структура рассматривает только один набор исходных данных
- Чувствительность к выбору априорного распределения: Выбор априорного распределения для α в NPP требует дальнейшего исследования
- Вычислительные затраты: Хотя улучшено по сравнению с традиционными методами, всё ещё требует значительных вычислительных ресурсов
- Расширение на множественные исходные данные: Рассмотрение последовательной или параллельной интеграции нескольких наборов исходных данных
- Адаптивные априорные распределения: Разработка более обоснованных стратегий выбора априорного распределения для α в NPP
- Другие методы трансфера: Расширение структуры оценки на методы commensurate prior и MAPA
- Сильная методологическая инновативность: Структура TSMC умно решает проблему вычисления нормализующей константы
- Практичность стандартов оценки: LOO-CV обеспечивает надёжный метод оценки без требования истинных параметров
- Тщательный дизайн экспериментов: Два имитационных исследования различной сложности всесторонне проверяют эффективность методов
- Прочная теоретическая база: Основано на байесовских принципах с строгими математическими выводами
- Недостаток проверки на реальных данных: Проверка только на имитационных данных, отсутствуют тематические исследования на реальных данных
- Ограниченная область применения методов: Главным образом сосредоточено на методе power prior, применимость к другим методам трансфертного обучения требует дальнейшей проверки
- Вычислительная сложность: Хотя более эффективно, чем традиционные методы, может столкнуться с проблемами масштабируемости для крупномасштабных задач
- Теоретический вклад: Предоставляет новую вычислительную и оценочную структуру для байесовского трансфертного обучения
- Практическая ценность: Структура TSMC может быть непосредственно применена к практическим задачам
- Воспроизводимость: Авторы предоставляют полное описание алгоритма и код
- Медицинские исследования: Использование исторических контрольных данных в клинических испытаниях
- Эпидемиология: Использование данных предыдущих эпидемий при вспышке новой болезни
- Инженерные приложения: Использование связанных исторических данных в новых условиях с дефицитом данных
- Общественные науки: Использование данных связанных исследований в исследованиях с малым размером выборки
В работе цитируются важные источники в этой области, включая:
- Ibrahim, J.G., Chen, M.-H., Sinha, D. (2003). Основополагающая работа по power prior
- Chopin, N. (2002). Классическая литература по последовательному методу Монте-Карло
- Vehtari, A., et al. (2024). Последние достижения в выборке по важности
- Carvalho, L.M., Ibrahim, J.G. (2021). Теоретическое развитие нормализованного power prior
Общая оценка: Это высококачественная статья по статистической методологии, вносящая важный вклад в область байесовского трансфертного обучения. Работа не только решает вычислительные проблемы существующих методов, но и предоставляет практические стандарты оценки, обладая значительной теоретической значимостью и прикладной ценностью.