PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
PrivTuner с гомоморфным шифрованием и LoRA: схема P3EFT для конфиденциальной параметрически эффективной тонкой настройки фундаментальных моделей ИИ
Название: PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Авторы: Yang Li, Wenhan Yu, Jun Zhao (Nanyang Technological University)
В данной работе предложена структура Privacy-Preserving Parameter-Efficient Fine-Tuning (P3EFT), объединяющая параметрически эффективную тонкую настройку (PEFT) с конфиденциальной тонкой настройкой (PPFT). Авторы разработали схему PrivTuner, интегрирующую полностью гомоморфное шифрование (FHE) в LoRA, что обеспечивает совместную конфиденциальную тонкую настройку между владельцем модели и внешними владельцами данных. Статья дополнительно рассматривает систему PrivTuner в среде беспроводной связи, устанавливает задачу совместной оптимизации для минимизации энергопотребления при максимизации конфиденциальности и предлагает соответствующие алгоритмы распределения ресурсов.
Требования конфиденциальности: Процесс тонкой настройки фундаментальных моделей ИИ содержит проблемы конфиденциальности данных и модели. Предприятия неохотно делятся приватными данными, а владельцы моделей не желают раскрывать параметры модели.
Вызовы вычислительной эффективности: Традиционная тонкая настройка со всеми параметрами требует огромных вычислительных затрат, особенно для крупных фундаментальных моделей, локальная тонкая настройка создает значительное бремя для устройств с ограниченными ресурсами.
Ограничения существующих методов:
Методы PEFT, хотя и снижают вычислительное бремя, игнорируют проблемы конфиденциальности
Методы PPFT могут защитить конфиденциальность, но обычно вводят дополнительные коммуникационные и вычислительные издержки
Существующие исследования сосредоточены в основном на отдельном применении PEFT или PPFT, отсутствует систематическое исследование их интеграции. Данная работа направлена на заполнение этого пробела, предложив структуру P3EFT для достижения двойной цели конфиденциальности и параметрической эффективности в условиях ограниченного вычислительного бюджета.
Предложена структура P3EFT: Впервые систематически объединены PEFT и PPFT, заполнен пробел между двумя областями исследований.
Разработана схема PrivTuner: Объединены схема полностью гомоморфного шифрования CKKS и технология LoRA, обеспечена безопасная и эффективная совместная тонкая настройка, защищающая конфиденциальность данных и модели при снижении вычислительного бремени.
Установлены модели потребления и защиты конфиденциальности: Проанализированы модели времени и энергопотребления с точки зрения сервера и устройства, предоставлены количественные показатели уровня защиты конфиденциальности.
Разработан алгоритм совместной оптимизации: Предложен алгоритм распределения ресурсов, объединяющий методы ветвей и границ (B&B) и дробного программирования, эффективно решающий задачу совместной оптимизации вычислительной мощности, ресурсов беспроводной связи и параметров FHE.
Задача P3EFT определяется как: при наличии предварительно обученной фундаментальной модели W₀ и приватного набора данных, осуществить тонкую настройку модели путем обновления только небольшого количества параметров при защите конфиденциальности данных и модели.
Органичное объединение FHE и LoRA: Впервые объединены полностью гомоморфное шифрование CKKS и технология LoRA, обеспечена параметрически эффективная тонкая настройка в зашифрованной области.
Обработка нелинейных функций: Систематически решены проблемы вычисления нелинейных функций в моделях Transformer в среде FHE.
Структура оптимизации ресурсов: Рассмотрены практические ограничения в среде беспроводной связи, установлена модель оптимизации компромисса между энергопотреблением и защитой конфиденциальности.
Компромисс между энергопотреблением и конфиденциальностью: При увеличении ω уровень защиты конфиденциальности повышается, но энергопотребление увеличивается
Стратегия выбора устройства: Устройства с высокой озабоченностью конфиденциальностью склонны выбирать большие значения λ
Осуществимость структуры P3EFT: PrivTuner успешно доказывает возможность одновременного достижения параметрической эффективности и защиты конфиденциальности
Проверка практичности: Достигнуты приемлемые результаты на наборе данных GLUE, относительно небольшие затраты на защиту конфиденциальности
Эффективность алгоритма оптимизации: Алгоритм совместного распределения ресурсов показывает отличные результаты в компромиссе между энергопотреблением и конфиденциальностью
Конфиденциальность адаптера: В текущей схеме адаптеры хранятся в открытом виде, что может привести к утечке информации
Вычислительные издержки: Операции FHE по-прежнему требуют значительных вычислительных затрат, ограничивая приложения в реальном времени
Ограничения модели безопасности: Рассматривается только модель честного, но любопытного противника, не рассматриваются сценарии с враждебными противниками
Проблемы масштабируемости: С увеличением размера модели издержки FHE могут стать узким местом
Статья ссылается на множество важных работ, включая:
Оригинальная статья LoRA Hu et al., ICLR 2021
Схема полностью гомоморфного шифрования CKKS Cheon et al., 2017
Модель BERT Devlin et al., 2018
Связанные работы по конфиденциальному глубокому обучению
Общая оценка: Это высококачественная исследовательская статья, демонстрирующая отличные результаты в технической инновации, теоретическом анализе и экспериментальной проверке. Несмотря на некоторые ограничения, она открывает важное направление исследований в области конфиденциального ИИ и имеет значительную академическую ценность и перспективы применения.