Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic
Федеративное условное конформное предсказание через генеративные модели
Конформное предсказание (Conformal Prediction, CP) обеспечивает квантификацию неопределённости без распределительных предположений путём построения наборов предсказаний, гарантирующих покрытие истинных меток. Эта надёжность делает CP ценным инструментом в высокорисковых сценариях федеративного обучения, таких как многоцентровая медицина. Однако стандартное CP предполагает независимость и одинаковое распределение данных (i.i.d.), что нарушается в федеративных условиях с существенной вариативностью распределений на клиентах. Существующие методы федеративного CP решают эту проблему путём поддержания маргинального покрытия на каждом клиенте, но такие гарантии часто не отражают условную неопределённость входных данных. В данной работе предлагается федеративное условное конформное предсказание на основе генеративных моделей (Fed-CCP), направленное на достижение условного покрытия, адаптивного к локальной неоднородности данных. Fed-CCP использует генеративные модели, такие как нормализующие потоки или модели диффузии, для аппроксимации условного распределения данных без необходимости обмена исходными данными. Это позволяет каждому клиенту локально калибровать конформные оценки, отражающие его уникальную неопределённость, при этом сохраняя глобальную согласованность через федеративную агрегацию.
Основная проблема: Как реализовать конформное предсказание в среде федеративного обучения, которое одновременно защищает конфиденциальность и обеспечивает квантификацию условной неопределённости входных данных?
Важность проблемы:
В высокорисковых областях, таких как медицина и финансы, требуется надёжная квантификация неопределённости
В сценариях федеративного обучения данные не могут быть централизованы, существует значительная неоднородность распределений
Требования защиты конфиденциальности ограничивают обмен исходными данными
Ограничения существующих методов:
Стандартное CP предполагает i.i.d. данные, что неприменимо в федеративных условиях
Существующие методы федеративного CP (FCP, FedCP-QQ, DP-FedCP) сосредоточены только на маргинальном покрытии
Маргинальное покрытие производит интервалы предсказания единообразной ширины, не отражающие специфичную для экземпляра неопределённость
Отсутствуют эффективные методы реализации условного покрытия в федеративных условиях
Исследовательская мотивация:
Необходимость реализации адаптивной, специфичной для экземпляра квантификации неопределённости с защитой конфиденциальности
Использование способности генеративных моделей преобразовывать распределения для унификации неоднородных распределений клиентов
Реализация условного покрытия в пространстве эталонного распределения с последующим преобразованием обратно в исходное пространство распределения
Предложение框架Fed-CCP: Впервые реализовано условное конформное предсказание в федеративном обучении через построение преобразуемых наборов предсказаний с использованием генеративных моделей
Теоретические инновации: Использование биективного преобразования для сохранения гарантий условного покрытия при преобразовании из пространства эталонного гауссова распределения в исходное пространство данных клиента
Дизайн защиты конфиденциальности: Обучение генеративных моделей только через обмен градиентами без необходимости обмена исходными данными
Адаптивность клиента: Введение условителя клиента η для моделирования неоднородности между клиентами
Экспериментальная верификация: Проверка эффективности метода в 5 областях: медицина, страхование, интернет вещей, эпидемиология и прогнозирование трафика
Учитывая K клиентов, где данные каждого клиента k следуют распределению QXY(k), целью является построение набора предсказаний CTrans(Xn+1), удовлетворяющего гарантии условного покрытия:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
Обучение обратимого преобразования fθ распределения клиента QXY в эталонное распределение PXY
Использование формулы замены переменных для оптимизации расхождения KL:
minθDKL(fθ#qXY∥pXY)=minθ−E(x,y)∼QXY[logpXY(fθ(x,y))+log∣det∂(x,y)∂fθ(x,y)∣−1]
Модели диффузии (Diffusion Models):
Реализация процесса прямой диффузии через стохастическое дифференциальное уравнение:
d(Xt,Yt)=−21βt(Xt,Yt)dt+βtdWt
Обучение обратного процесса удаления шума для аппроксимации обратного преобразования g≈f−1
Введение условителя клиента η(k)∼N(μ(k),(σ(k))2), позволяющего условной генеративной модели fθ(x,y;η) адаптироваться к характеристикам распределения различных клиентов.
Гарантия биективности: Использование обратимости генеративных моделей для обеспечения сохранения гарантий условного покрытия при преобразовании распределений
Механизм условителя: Моделирование неоднородности между клиентами через гауссовский условитель, специфичный для каждого клиента
Защита конфиденциальности: Базовая модель предсказания h обучается только на эталонном гауссовом распределении, обучение генеративной модели предполагает только обмен информацией о градиентах
Унифицированная структура: Отображение неоднородных распределений клиентов в единое эталонное распределение для реализации условного покрытия
Статья цитирует важные работы в областях конформного предсказания, федеративного обучения и генеративных моделей, включая:
Теоретические основы конформного предсказания Вовка и соавторов
Метод CQR Романо и соавторов
Работы Лу и соавторов по федеративному конформному предсказанию
Классические работы по нормализующим потокам и моделям диффузии
Общая оценка: Это высококачественная статья в области машинного обучения, вносящая значительный вклад в пересечение федеративного обучения и квантификации неопределённости. Метод инновационен, эксперименты комплексны, работа имеет важное теоретическое и практическое значение. Рекомендуется дальнейшее совершенствование в области теоретического анализа и вычислительной эффективности.