PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
PrivTuner con Crittografia Omomorfa e LoRA: Uno Schema P3EFT per l'Ottimizzazione Fine-Tuning Preservante la Privacy dei Modelli Fondamentali di IA
Questo articolo propone il framework Privacy-Preserving Parameter-Efficient Fine-Tuning (P3EFT), che combina l'ottimizzazione fine-tuning parametricamente efficiente (PEFT) con l'ottimizzazione fine-tuning preservante la privacy (PPFT). Gli autori progettano lo schema PrivTuner, integrando la crittografia completamente omomorfa (FHE) in LoRA, realizzando un fine-tuning collaborativo preservante la privacy tra il proprietario del modello e i proprietari di dati esterni. L'articolo considera inoltre il sistema PrivTuner in ambienti di comunicazione wireless, stabilendo un problema di ottimizzazione congiunta per minimizzare il consumo energetico massimizzando contemporaneamente la protezione della privacy, e propone algoritmi corrispondenti di allocazione delle risorse.
Esigenze di Protezione della Privacy: Nel processo di fine-tuning dei modelli fondamentali di IA esistono problemi di privacy dei dati e privacy del modello. Le aziende sono riluttanti a condividere dati privati, mentre i proprietari di modelli non desiderano esporre i parametri del modello.
Sfide di Efficienza Computazionale: L'ottimizzazione fine-tuning tradizionale a parametri completi comporta enormi costi computazionali, in particolare per i modelli fondamentali di grandi dimensioni, rappresentando un onere significativo per i dispositivi con risorse limitate.
Limitazioni dei Metodi Esistenti:
I metodi PEFT, sebbene riducano il carico computazionale, trascurano i problemi di protezione della privacy
I metodi PPFT possono proteggere la privacy, ma generalmente introducono costi aggiuntivi di comunicazione e computazione
La ricerca esistente si concentra principalmente sull'applicazione separata di PEFT o PPFT, mancando di uno studio sistematico della loro fusione. Questo articolo mira a colmare questa lacuna, proponendo il framework P3EFT per realizzare i duplici obiettivi di protezione della privacy ed efficienza parametrica con budget computazionale limitato.
Propone il Framework P3EFT: Per la prima volta combina sistematicamente PEFT e PPFT, colmando il divario tra due ambiti di ricerca.
Progetta lo Schema PrivTuner: Combina lo schema di crittografia omomorfa CKKS con la tecnologia LoRA, realizzando un fine-tuning collaborativo sicuro ed efficiente, riducendo il carico computazionale proteggendo contemporaneamente la privacy dei dati e del modello.
Stabilisce Modelli di Consumo e Protezione della Privacy: Analizza i modelli di tempo e consumo energetico dal punto di vista del server e del dispositivo, fornendo metriche quantificate per i livelli di protezione della privacy.
Progetta Algoritmi di Ottimizzazione Congiunta: Propone algoritmi di allocazione delle risorse che combinano tecniche di branch-and-bound (B&B) e programmazione frazionaria, risolvendo efficacemente il problema di ottimizzazione congiunta della capacità computazionale, delle risorse di comunicazione wireless e della configurazione FHE.
Il compito P3EFT è definito come: dato un modello fondamentale pre-addestrato W₀ e un dataset privato, realizzare il fine-tuning del modello aggiornando solo un numero limitato di parametri, proteggendo la privacy dei dati e del modello.
Combinazione Organica di FHE e LoRA: Per la prima volta combina la crittografia omomorfa completamente CKKS con la tecnologia LoRA, realizzando l'ottimizzazione fine-tuning parametricamente efficiente nel dominio crittografato.
Gestione delle Funzioni Non Lineari: Risolve sistematicamente il problema del calcolo delle funzioni non lineari nei modelli Transformer nell'ambiente FHE.
Framework di Ottimizzazione delle Risorse: Considera i vincoli pratici in ambienti di comunicazione wireless, stabilendo un modello di ottimizzazione del compromesso tra consumo energetico e protezione della privacy.
Con diverse configurazioni di risorse, l'algoritmo di ottimizzazione congiunta proposto rispetto ai metodi di base:
Variazione della Larghezza di Banda: Quando la larghezza di banda totale aumenta da 5MHz a 25MHz, l'algoritmo mantiene costantemente prestazioni ottimali
Potenza di Trasmissione: Nell'intervallo 10-30dBm, l'algoritmo di ottimizzazione mostra prestazioni stabili
Budget Temporale: Con l'aumento del budget temporale del dispositivo, il consumo energetico diminuisce significativamente
Fattibilità del Framework P3EFT: PrivTuner dimostra con successo la possibilità di realizzare contemporaneamente efficienza parametrica e protezione della privacy
Verifica della Praticità: Raggiunge prestazioni accettabili sul dataset GLUE, con costi di protezione della privacy relativamente piccoli
Efficacia dell'Algoritmo di Ottimizzazione: L'algoritmo di allocazione congiunta delle risorse mostra prestazioni eccellenti nel compromesso consumo energetico-privacy
Privacy dell'Adattatore: Nello schema attuale, gli adattatori sono archiviati in forma di testo in chiaro, potenzialmente rivelando informazioni parziali
Costi Computazionali: Le operazioni FHE comportano ancora costi computazionali significativi, limitando le applicazioni in tempo reale
Limitazioni del Modello di Sicurezza: Considera solo il modello onesto ma curioso, non affrontando scenari di avversari malevoli
Problemi di Scalabilità: Con l'aumento della dimensione del modello, i costi FHE potrebbero diventare un collo di bottiglia
L'articolo cita numerosi lavori importanti, inclusi:
Articolo originale di LoRA Hu et al., ICLR 2021
Schema di crittografia omomorfa CKKS Cheon et al., 2017
Modello BERT Devlin et al., 2018
Lavori correlati sull'apprendimento profondo preservante la privacy
Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità, che si distingue per l'innovazione tecnica, l'analisi teorica e la verifica sperimentale. Sebbene presenti alcune limitazioni, apre importanti direzioni di ricerca nel campo dell'IA preservante la privacy, con significativo valore accademico e prospettive di applicazione.