Текстовые данные приобретают исключительную ценность в больших языковых моделях (LLM) и потенциально могут способствовать развитию общего искусственного интеллекта (AGI). Однако в реальном мире многие высококачественные текстовые данные являются приватными и не могут свободно использоваться из-за проблем конфиденциальности. Таким образом, дифференциально приватная (DP) генерация синтетического текста была предложена с целью создания синтетических данных высокой полезности при одновременной защите конфиденциальной информации. Однако существующие методы DP генерации синтетического текста применяют единые гарантии, часто чрезмерно защищая неконфиденциальное содержимое, что приводит к значительной потере полезности и вычислительным затратам. В данной работе предлагается Secret-Protected Evolution (SecPE) — новая структура, расширяющая приватную эволюцию посредством защиты, осведомленной о секретах. Теоретически доказано, что SecPE удовлетворяет (p,r)-защите секретов, которая является ослаблением гауссовой DP, достигая более плотного компромисса между полезностью и приватностью при одновременном значительном снижении вычислительной сложности по сравнению с базовыми методами.
С быстрым развитием больших языковых моделей ценность текстовых данных постоянно возрастает. Однако обучение и адаптация этих моделей обычно зависит от больших объемов приватных пользовательских текстовых данных, что создает серьезные риски конфиденциальности, включая запоминание и утечку конфиденциального содержимого.
Конфликт между ценностью данных и приватностью: Высококачественные текстовые данные критически важны для LLM, но использование приватных данных ограничено нормативными требованиями конфиденциальности
Ограничения существующих методов: Традиционные методы дифференциальной приватности обеспечивают единую защиту для всех записей, даже если конфиденциальная информация может быть редкой и варьироваться между пользователями и атрибутами
Проблемы вычислительной эффективности: Существующие методы приватной эволюции (PE) требуют обширных попарных вычислений сходства, что создает огромные вычислительные издержки
Предложена структура SecPE: Структура для генерации приватных синтетических данных, подчеркивающая защиту секретов, а не традиционную DP, повышающая полезность за счет снижения шума, обычно требуемого DP
Разработан метод кластеризации с защитой секретов: Значительно снижает временную сложность выполнения по сравнению с методом PE с O(MNsyn) до O(KNsyn), где K≪M
Теоретические гарантии: Доказано, что SecPE удовлетворяет (p,r)-защите секретов, которая является ослабленной версией гауссовой DP
Экспериментальная верификация: На наборах данных OpenReview, PubMed и Yelp SecPE достигает более высокой эффективности, более низкого FID и лучшей точности нижестоящих задач при одинаковых гарантиях реконструкции
Учитывая приватный набор текстовых данных, содержащий конфиденциальные секреты, необходимо сгенерировать высококачественные синтетические текстовые данные, которые:
Сохраняют статистические характеристики, аналогичные исходным данным
Защищают конкретные секреты от реконструкции
Сохраняют хорошую производительность на нижестоящих задачах
Определение 3.1 (Защита секретов): Пусть D = {x₁,...,xₙ} — набор обучающих данных, где каждый образец может содержать секреты из S = {s₁,...,sₘ}. Для секрета sⱼ∈S пусть πⱼ — априорное распределение на наборе данных {D¹ⱼ,...,Dᴷⱼ}, удовлетворяющее Pr(Dᵏⱼ) ≤ pⱼ, где D и Dᵏⱼ отличаются только наличием sⱼ. Случайный механизм A удовлетворяет (p,r)-защите секретов, если для любой атаки реконструкции B:
Ослабление ограничений DP: (p,r)-защита секретов ограничивает только вероятность успеха противника с единственной априорной вероятностью, а не всю кривую компромисса
Рисунок 2 показывает, что при уменьшении r/p SecPE достигает более низкого FID (более высокого сходства), в то время как в непривативном режиме FID немного выше, но в целом сопоставим.
DP-Generator: Использует DP-SGD для обучения языковых моделей, требует больших вычислительных ресурсов и большого количества высококачественных приватных данных
Private Evolution (PE): Использует доступ через API к базовой модели, итеративно обновляя случайно инициализированные образцы
Вклад данной работы: Переход от единой защиты к защите, осведомленной о секретах
Потеря абстракции кластеризации: Кластеризация может абстрагировать мелкозернистые детали, потенциально приводя к небольшой потере полезности в непривативном режиме
Вызовы определения секретов: Как формально определить секреты и количественно оценить их конфиденциальность остается открытым вопросом
Область применения: Метод предполагает редкое и повторяющееся конфиденциальное содержимое, что может быть неприменимо во всех сценариях