2025-11-20T05:58:13.871627

Secret-Protected Evolution for Differentially Private Synthetic Text Generation

Wang, Chen, Du et al.

Text data has become extremely valuable on large language models (LLMs) and even lead to general artificial intelligence (AGI). A lot of high-quality text in the real world is private and cannot be freely used due to privacy concerns. Therefore, differentially private (DP) synthetic text generation has been proposed, aiming to produce high-utility synthetic data while protecting sensitive information. However, existing DP synthetic text generation imposes uniform guarantees that often overprotect non-sensitive content, resulting in substantial utility loss and computational overhead. Therefore, we propose Secret-Protected Evolution (SecPE), a novel framework that extends private evolution with secret-aware protection. Theoretically, we show that SecPE satisfies $(\mathrm{p}, \mathrm{r})$-secret protection, constituting a relaxation of Gaussian DP that enables tighter utility-privacy trade-offs, while also substantially reducing computational complexity relative to baseline methods. Empirically, across the OpenReview, PubMed, and Yelp benchmarks, SecPE consistently achieves lower FrÃ©chet Inception Distance (FID) and higher downstream task accuracy than GDP-based Aug-PE baselines, while requiring less noise to attain the same level of protection. Our results highlight that secret-aware guarantees can unlock more practical and effective privacy-preserving synthetic text generation.

academic

Защита секретов в эволюции для дифференциально приватной генерации синтетического текста

Основная информация

ID статьи: 2510.10990
Название: Secret-Protected Evolution for Differentially Private Synthetic Text Generation
Авторы: Tianze Wang¹'², Zhaoyu Chen¹, Jian Du¹†, Yingtai Xiao¹, Linjun Zhang², Qiang Yan¹ (¹TikTok, ²Rutgers University)
Классификация: cs.CR (Криптография и безопасность), cs.CL (Вычислительная лингвистика), cs.NE (Нейронные и эволюционные вычисления)
Дата публикации: 13 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.10990

Аннотация

Текстовые данные приобретают исключительную ценность в больших языковых моделях (LLM) и потенциально могут способствовать развитию общего искусственного интеллекта (AGI). Однако в реальном мире многие высококачественные текстовые данные являются приватными и не могут свободно использоваться из-за проблем конфиденциальности. Таким образом, дифференциально приватная (DP) генерация синтетического текста была предложена с целью создания синтетических данных высокой полезности при одновременной защите конфиденциальной информации. Однако существующие методы DP генерации синтетического текста применяют единые гарантии, часто чрезмерно защищая неконфиденциальное содержимое, что приводит к значительной потере полезности и вычислительным затратам. В данной работе предлагается Secret-Protected Evolution (SecPE) — новая структура, расширяющая приватную эволюцию посредством защиты, осведомленной о секретах. Теоретически доказано, что SecPE удовлетворяет (p,r)-защите секретов, которая является ослаблением гауссовой DP, достигая более плотного компромисса между полезностью и приватностью при одновременном значительном снижении вычислительной сложности по сравнению с базовыми методами.

Исследовательский контекст и мотивация

Определение проблемы

С быстрым развитием больших языковых моделей ценность текстовых данных постоянно возрастает. Однако обучение и адаптация этих моделей обычно зависит от больших объемов приватных пользовательских текстовых данных, что создает серьезные риски конфиденциальности, включая запоминание и утечку конфиденциального содержимого.

Важность проблемы

Конфликт между ценностью данных и приватностью: Высококачественные текстовые данные критически важны для LLM, но использование приватных данных ограничено нормативными требованиями конфиденциальности
Ограничения существующих методов: Традиционные методы дифференциальной приватности обеспечивают единую защиту для всех записей, даже если конфиденциальная информация может быть редкой и варьироваться между пользователями и атрибутами
Проблемы вычислительной эффективности: Существующие методы приватной эволюции (PE) требуют обширных попарных вычислений сходства, что создает огромные вычислительные издержки

Исследовательская мотивация

Существующие методы DP предполагают, что каждая запись одинаково конфиденциальна, но в действительности:

Конфиденциальная информация может быть редко распределена
Степень конфиденциальности варьируется между пользователями и атрибутами
Секреты могут повторяться между записями
Единые гарантии приводят к чрезмерной защите и потере полезности

Основные вклады

Предложена структура SecPE: Структура для генерации приватных синтетических данных, подчеркивающая защиту секретов, а не традиционную DP, повышающая полезность за счет снижения шума, обычно требуемого DP
Разработан метод кластеризации с защитой секретов: Значительно снижает временную сложность выполнения по сравнению с методом PE с O(MNsyn) до O(KNsyn), где K≪M
Теоретические гарантии: Доказано, что SecPE удовлетворяет (p,r)-защите секретов, которая является ослабленной версией гауссовой DP
Экспериментальная верификация: На наборах данных OpenReview, PubMed и Yelp SecPE достигает более высокой эффективности, более низкого FID и лучшей точности нижестоящих задач при одинаковых гарантиях реконструкции

Подробное описание метода

Определение задачи

Учитывая приватный набор текстовых данных, содержащий конфиденциальные секреты, необходимо сгенерировать высококачественные синтетические текстовые данные, которые:

Сохраняют статистические характеристики, аналогичные исходным данным
Защищают конкретные секреты от реконструкции
Сохраняют хорошую производительность на нижестоящих задачах

Определение защиты секретов

Определение 3.1 (Защита секретов): Пусть D = {x₁,...,xₙ} — набор обучающих данных, где каждый образец может содержать секреты из S = {s₁,...,sₘ}. Для секрета sⱼ∈S пусть πⱼ — априорное распределение на наборе данных {D¹ⱼ,...,Dᴷⱼ}, удовлетворяющее Pr(Dᵏⱼ) ≤ pⱼ, где D и Dᵏⱼ отличаются только наличием sⱼ. Случайный механизм A удовлетворяет (p,r)-защите секретов, если для любой атаки реконструкции B:

Pr[B(A(Dⱼ)) = sⱼ] ≤ rⱼ, ∀j

Архитектура модели

Структура SecPE содержит два основных компонента:

1. Кластеризация секретов (Secret Clustering)

Цель: Использовать открытые данные для кластеризации, затем обновить с помощью зашумленных приватных данных для формирования репрезентативных центров
Алгоритм:
1. Выполнить K-means кластеризацию на открытых данных: {(eₖ, nₖ)}ᴷₖ₌₁ = Kmeans(Dpub, K)
2. Назначить приватные данные ближайшим открытым центрам
3. Добавить откалиброванный шум для обновления статистики кластеризации

2. Защищенная эволюция (Protected Evolution)

Цель: Выполнить итеративный отбор на основе зашумленных представителей, а не прямого голосования по приватным данным
Преимущество: Снижает сложность с O(MNsyn) до O(KNsyn)

Калибровка шума

Алгоритм 1 (SecretNoise): Назначить веса каждому приватному образцу через линейное программирование:

max Σwᵢ subject to Σwᵢ ≤ ηⱼ, wᵢ ∈ [0,1]

где ηⱼ = Φ⁻¹(1-pⱼ) - Φ⁻¹(1-rⱼ) как ограничение емкости.

Технические инновации

От приватности членства к защите секретов: Не защищать членство в наборе данных, а защищать конкретное содержимое секретов
Ускорение кластеризации: Заменить поточечное голосование голосованием представителей, значительно повысив вычислительную эффективность
Ослабление ограничений DP: (p,r)-защита секретов ограничивает только вероятность успеха противника с единственной априорной вероятностью, а не всю кривую компромисса

Экспериментальная установка

Наборы данных

OpenReview: Рецензии на статьи ICLR 2023, аннотированные по исследовательским областям и оценкам рекомендаций
PubMed: Аннотации медицинских статей
Yelp: Пользовательские отзывы о компаниях, аннотированные по категориям компаний и оценкам

Метрики оценки

Вычислительная эффективность: GPU-часы и время вычисления гистограмм
Производительность нижестоящих задач: Точность классификации при тонкой настройке RoBERTa/BERT на синтетических данных
Сходство реальных и синтетических данных: FID на встраиваниях текста и сравнение распределений длин текста

Методы сравнения

Aug-PE: Расширенный метод приватной эволюции на основе μ-GDP
Различные числа кластеров K: SecPE₂₀₀₀, SecPE₃₀₀₀, SecPE₄₀₀₀ и другие варианты

Детали реализации

Модели генерации: GPT-2, Qwen-2.5-1.5B (основные эксперименты), Llama-3.1-8B, GPT-4o-Mini (абляция)
Модели встраивания: Sentence-Transformers
Бюджеты приватности: p = 1×10⁻⁴, r/p ∈ {2, 10, 50, ∞}

Результаты экспериментов

Основные результаты

Сравнение времени выполнения

Таблица 2 показывает значительное ускорение SecPE при построении гистограмм:

OpenReview: 126.9s → 1.5s (84× ускорение)
PubMed: 32.2s → 0.5s (64× ускорение)
Yelp: 30126.4s → 2.3s (примерно 13,000× ускорение)

Производительность нижестоящих задач

На всех наборах данных SecPE последовательно превосходит Aug-PE:

PubMed (Таблица 3):

GPT-2 + BERT-small: Aug-PE от 29.70→24.93 (r/p: ∞→2), SecPE от 29.19→29.18
Чем строже требования приватности, тем более очевидны преимущества SecPE

Yelp (Таблица 5):

При r/p=2 SecPE₈₀₀ достигает 72.74% при классификации категорий против 71.53% для Aug-PE
При классификации оценок SecPE₈₀₀ достигает 62.46% против 47.02% для Aug-PE

Сходство реальных и синтетических данных

Рисунок 2 показывает, что при уменьшении r/p SecPE достигает более низкого FID (более высокого сходства), в то время как в непривативном режиме FID немного выше, но в целом сопоставим.

Абляционные исследования

Влияние выбора LLM (Таблица 6)

Более мощные LLM дают лучшие результаты:

GPT-4o-mini (74.84, 62.96) > GPT-2 (73.82, 58.36)
Qwen-2.5-7B (74.56, 63.06) > Qwen-2.5-1.5B (73.12, 62.08)

Влияние числа кластеров K

Эксперименты показывают, что производительность нечувствительна к выбору K, что демонстрирует робастность метода.

Результаты задачи PII

На реальной задаче обнаружения PII улучшения SecPE по сравнению с Aug-PE более скромные, но метод остается конкурентоспособным.

Связанные работы

Дифференциально приватная генерация текста

DP-Generator: Использует DP-SGD для обучения языковых моделей, требует больших вычислительных ресурсов и большого количества высококачественных приватных данных
Private Evolution (PE): Использует доступ через API к базовой модели, итеративно обновляя случайно инициализированные образцы
Вклад данной работы: Переход от единой защиты к защите, осведомленной о секретах

Защита секретов против дифференциальной приватности

Традиционная DP: Защищает членство, обеспечивает единую защиту для всех записей
Защита секретов: Калибрует гарантии для конкретных секретов, позволяя использовать открытые данные без защиты

Заключение и обсуждение

Основные выводы

SecPE достигает лучшего компромисса между полезностью и приватностью благодаря защите, осведомленной о секретах
Метод кластеризации значительно повышает вычислительную эффективность
Последовательно превосходит базовый метод GDP на нескольких наборах данных
Более мощные LLM производят синтетический текст более высокого качества

Ограничения

Потеря абстракции кластеризации: Кластеризация может абстрагировать мелкозернистые детали, потенциально приводя к небольшой потере полезности в непривативном режиме
Вызовы определения секретов: Как формально определить секреты и количественно оценить их конфиденциальность остается открытым вопросом
Область применения: Метод предполагает редкое и повторяющееся конфиденциальное содержимое, что может быть неприменимо во всех сценариях

Направления будущих исследований

Исследовать гетерогенные, специфичные для секретов бюджеты и адаптивные априорные вероятности
Расширить на область изображений и исследовать генераторы с защитой секретов
Дополнительно стандартизировать использование приватных данных

Глубокая оценка

Преимущества

Теоретическая инновация: Концепция (p,r)-защиты секретов является новой и предоставляет новую перспективу для защиты приватности
Практическая ценность: Значительное ускорение вычислений делает метод более применимым на практике
Полная экспериментальная оценка: Комплексная оценка на нескольких наборах данных и метриках
Строгая техника: Тщательный теоретический анализ и доказательства

Недостатки

Идентификация секретов: Статья недостаточно обсуждает, как практически идентифицировать и определять "секреты"
Ограничения базовых методов: Основное сравнение проводится с одним базовым методом, отсутствует сравнение с другими методами DP генерации текста
Обобщаемость: Улучшения на задаче PII ограничены, требуется дальнейшая верификация обобщающей способности метода

Влияние

Научный вклад: Предоставляет новую теоретическую структуру для генерации приватных синтетических данных
Практическая ценность: Значительное улучшение вычислительной эффективности делает метод более подходящим для крупномасштабных приложений
Воспроизводимость: Предоставляет подробные детали реализации и настройки гиперпараметров

Сценарии применения

Текстовые данные, где конфиденциальная информация редка и типы известны
Приложения, требующие крупномасштабной генерации приватного защищенного текста
Сценарии с высокими требованиями к вычислительной эффективности
Приложения в конкретных областях, где можно четко определить "секреты"

Библиография

Статья ссылается на важные работы в областях защиты приватности, дифференциальной приватности и генерации текста, включая:

Abadi et al. (2016): Фундаментальная работа по DP-SGD
Dong et al. (2019): Теория гауссовой дифференциальной приватности
Xie et al. (2024): Метод Private Evolution
Ganesh et al. (2025): Теоретические основы защиты секретов