PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
PrivTuner con Cifrado Homomórfico y LoRA: Un Esquema P3EFT para Ajuste Fino Eficiente en Parámetros con Preservación de Privacidad de Modelos Fundacionales de IA
Este artículo propone el marco Privacy-Preserving Parameter-Efficient Fine-Tuning (P3EFT), que combina el ajuste fino eficiente en parámetros (PEFT) con el ajuste fino con preservación de privacidad (PPFT). Los autores diseñan el esquema PrivTuner, integrando cifrado completamente homomórfico (FHE) en LoRA, logrando un ajuste fino colaborativo con preservación de privacidad entre el propietario del modelo y propietarios de datos externos. El artículo considera además el sistema PrivTuner en entornos de comunicación inalámbrica, estableciendo un problema de optimización conjunta para minimizar el consumo de energía mientras se maximiza la preservación de privacidad, y propone algoritmos correspondientes de asignación de recursos.
Requisitos de Preservación de Privacidad: El proceso de ajuste fino de modelos fundacionales de IA presenta problemas de privacidad de datos y privacidad del modelo. Las empresas no desean compartir datos privados, mientras que los propietarios de modelos tampoco desean exponer los parámetros del modelo.
Desafíos de Eficiencia Computacional: El ajuste fino tradicional de parámetros completos conlleva una sobrecarga computacional enorme, especialmente para modelos fundacionales grandes, imponiendo una carga significativa en dispositivos con recursos limitados.
Limitaciones de Métodos Existentes:
Los métodos PEFT, aunque reducen la carga computacional, ignoran los problemas de preservación de privacidad
Los métodos PPFT pueden proteger la privacidad, pero generalmente introducen gastos adicionales de comunicación y computación
La investigación existente se enfoca principalmente en aplicaciones individuales de PEFT o PPFT, careciendo de investigación sistemática sobre la fusión de ambos. Este artículo tiene como objetivo llenar este vacío, proponiendo el marco P3EFT para lograr los objetivos duales de preservación de privacidad y eficiencia de parámetros bajo presupuestos computacionales limitados.
Propone el Marco P3EFT: Por primera vez, combina sistemáticamente PEFT y PPFT, cerrando la brecha entre dos campos de investigación.
Diseña el Esquema PrivTuner: Combina el esquema de cifrado completamente homomórfico CKKS con la técnica LoRA, logrando un ajuste fino colaborativo seguro y eficiente, protegiendo la privacidad de datos y modelos mientras reduce la carga computacional.
Establece Modelos de Consumo y Preservación de Privacidad: Analiza modelos de tiempo y consumo de energía desde perspectivas de servidor y dispositivo, proporcionando métricas cuantificables para niveles de preservación de privacidad.
Diseña Algoritmo de Optimización Conjunta: Propone un algoritmo de asignación de recursos que combina técnicas de ramificación y acotamiento (B&B) y programación fraccional, resolviendo efectivamente el problema de optimización conjunta de capacidad computacional, recursos de comunicación inalámbrica y configuración de FHE.
La tarea P3EFT se define como: dado un modelo fundacional preentrenado W₀ y un conjunto de datos privado, actualizar solo una pequeña cantidad de parámetros para lograr el ajuste fino del modelo, preservando la privacidad de datos y del modelo.
Combinación Orgánica de FHE y LoRA: Por primera vez, combina cifrado completamente homomórfico CKKS con la técnica LoRA, logrando ajuste fino eficiente en parámetros en el dominio cifrado.
Procesamiento de Funciones No Lineales: Resuelve sistemáticamente el problema computacional de funciones no lineales en modelos Transformer en entornos FHE.
Marco de Optimización de Recursos: Considera restricciones prácticas en entornos de comunicación inalámbrica, estableciendo un modelo de optimización de compensación entre consumo de energía y preservación de privacidad.
Viabilidad del Marco P3EFT: PrivTuner demuestra exitosamente la posibilidad de lograr simultáneamente eficiencia de parámetros y preservación de privacidad
Validación de Practicidad: Logra un rendimiento aceptable en el conjunto de datos GLUE, con un costo relativamente pequeño en preservación de privacidad
Efectividad del Algoritmo de Optimización: El algoritmo de asignación de recursos conjunta muestra un rendimiento excelente en la compensación entre energía y privacidad
Innovación Fuerte: Por primera vez, combina sistemáticamente PEFT y PPFT, llenando un vacío de investigación importante
Teoría Completa: Proporciona un marco de análisis teórico completo, incluyendo análisis de seguridad, complejidad y convergencia
Experimentos Suficientes: Verifica la efectividad del método desde múltiples dimensiones, incluyendo precisión, consumo de energía y preservación de privacidad
Consideraciones Prácticas: Considera restricciones reales en entornos de comunicación inalámbrica, con buenas perspectivas de aplicación
Degradación de Rendimiento: Los gastos computacionales introducidos por FHE resultan en una degradación de rendimiento significativa (pérdida de precisión de aproximadamente 3-4%)
Limitaciones de Escalabilidad: Los experimentos actuales se realizan solo en BERT-Tiny, la aplicabilidad en modelos grandes requiere verificación
Suposiciones de Seguridad: El modelo honesto pero curioso podría ser demasiado idealizado en aplicaciones prácticas
Ajuste de Parámetros: La selección de múltiples parámetros FHE requiere conocimiento especializado, aumentando la barrera de uso
El artículo cita múltiples trabajos importantes, incluyendo:
Artículo original de LoRA Hu et al., ICLR 2021
Esquema de cifrado homomórfico CKKS Cheon et al., 2017
Modelo BERT Devlin et al., 2018
Trabajos relacionados en aprendizaje profundo con preservación de privacidad
Evaluación General: Este es un artículo de investigación de alta calidad que demuestra un desempeño excelente en innovación técnica, análisis teórico y verificación experimental. Aunque presenta algunas limitaciones, abre una dirección de investigación importante para el campo de IA con preservación de privacidad, poseyendo un valor académico significativo y perspectivas de aplicación prometedoras.