PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
होमोमॉर्फिक एन्क्रिप्शन और LoRA के साथ PrivTuner: AI फाउंडेशन मॉडल्स के गोपनीयता-संरक्षण पैरामीटर-कुशल फाइन-ट्यूनिंग के लिए एक P3EFT योजना
यह पेपर गोपनीयता-संरक्षण पैरामीटर-कुशल फाइन-ट्यूनिंग (P3EFT) ढांचा प्रस्तावित करता है, जो पैरामीटर-कुशल फाइन-ट्यूनिंग (PEFT) को गोपनीयता-संरक्षण फाइन-ट्यूनिंग (PPFT) के साथ जोड़ता है। लेखकों ने PrivTuner योजना डिजाइन की है, जो पूर्ण होमोमॉर्फिक एन्क्रिप्शन (FHE) को LoRA में एकीकृत करती है, जिससे मॉडल मालिकों और बाहरी डेटा मालिकों के बीच सहयोगी गोपनीयता-संरक्षण फाइन-ट्यूनिंग प्राप्त होती है। पेपर वायरलेस संचार वातावरण में PrivTuner सिस्टम पर विचार करता है, ऊर्जा खपत को कम करते हुए गोपनीयता संरक्षण को अधिकतम करने के लिए एक संयुक्त अनुकूलन समस्या स्थापित करता है, और संबंधित संसाधन आवंटन एल्गोरिदम प्रस्तावित करता है।
गोपनीयता संरक्षण की आवश्यकता: AI फाउंडेशन मॉडल्स की फाइन-ट्यूनिंग प्रक्रिया में डेटा गोपनीयता और मॉडल गोपनीयता समस्याएं मौजूद हैं। उद्यम निजी डेटा साझा करने के लिए अनिच्छुक हैं, साथ ही मॉडल मालिक भी मॉडल पैरामीटर को उजागर करने के लिए अनिच्छुक हैं।
कम्प्यूटेशनल दक्षता चुनौती: पारंपरिक पूर्ण-पैरामीटर फाइन-ट्यूनिंग विशाल कम्प्यूटेशनल ओवरहेड प्रस्तुत करती है, विशेष रूप से बड़े फाउंडेशन मॉडल्स के लिए, स्थानीय फाइन-ट्यूनिंग संसाधन-सीमित उपकरणों के लिए एक महत्वपूर्ण बोझ बनाता है।
मौजूदा विधियों की सीमाएं:
PEFT विधियां कम्प्यूटेशनल बोझ को कम करती हैं, लेकिन गोपनीयता संरक्षण समस्याओं को नजरअंदाज करती हैं
PPFT विधियां गोपनीयता की रक्षा कर सकती हैं, लेकिन आमतौर पर अतिरिक्त संचार और कम्प्यूटेशनल ओवरहेड प्रस्तुत करती हैं
मौजूदा अनुसंधान मुख्य रूप से PEFT या PPFT के अलग-अलग अनुप्रयोग पर केंद्रित है, दोनों के संलयन का व्यवस्थित अध्ययन अभाव है। यह पेपर इस अंतराल को भरने का लक्ष्य रखता है, P3EFT ढांचा प्रस्तावित करता है, जो सीमित कम्प्यूटेशनल बजट के तहत गोपनीयता संरक्षण और पैरामीटर दक्षता के दोहरे उद्देश्य को प्राप्त करता है।
P3EFT ढांचा प्रस्तावित करना: पहली बार व्यवस्थित रूप से PEFT और PPFT को जोड़ता है, दो अनुसंधान क्षेत्रों के बीच अंतराल को पाटता है।
PrivTuner योजना डिजाइन करना: CKKS पूर्ण होमोमॉर्फिक एन्क्रिप्शन योजना को LoRA तकनीक के साथ जोड़ता है, डेटा और मॉडल गोपनीयता की रक्षा करते हुए कम्प्यूटेशनल बोझ को कम करते हुए सुरक्षित और कुशल सहयोगी फाइन-ट्यूनिंग प्राप्त करता है।
खपत और गोपनीयता संरक्षण मॉडल स्थापित करना: सर्वर और डिवाइस दृष्टिकोण से समय और ऊर्जा खपत मॉडल का विश्लेषण करता है, गोपनीयता संरक्षण स्तर के लिए मात्रात्मक मेट्रिक्स प्रदान करता है।
संयुक्त अनुकूलन एल्गोरिदम डिजाइन करना: शाखा और बाउंड (B&B) और भिन्नात्मक प्रोग्रामिंग तकनीकों को जोड़ने वाला संसाधन आवंटन एल्गोरिदम प्रस्तावित करता है, कम्प्यूटेशनल क्षमता, वायरलेस संचार संसाधनों और FHE सेटिंग्स की संयुक्त अनुकूलन समस्या को प्रभावी ढंग से हल करता है।
P3EFT कार्य को इस प्रकार परिभाषित किया गया है: पूर्व-प्रशिक्षित फाउंडेशन मॉडल W₀ और निजी डेटासेट दिए गए हैं, डेटा गोपनीयता और मॉडल गोपनीयता की रक्षा करते हुए, केवल कुछ पैरामीटर अपडेट करके मॉडल फाइन-ट्यूनिंग प्राप्त करें।
FHE और LoRA का जैविक संयोजन: पहली बार CKKS पूर्ण होमोमॉर्फिक एन्क्रिप्शन को LoRA तकनीक के साथ जोड़ता है, एन्क्रिप्टेड डोमेन पर पैरामीटर-कुशल फाइन-ट्यूनिंग प्राप्त करता है।
गैर-रैखिक फ़ंक्शन्स हैंडलिंग: Transformer मॉडल में गैर-रैखिक फ़ंक्शन्स की FHE वातावरण में कम्प्यूटेशनल समस्याओं को व्यवस्थित रूप से हल करता है।
संसाधन अनुकूलन ढांचा: वायरलेस संचार वातावरण में व्यावहारिक बाधाओं पर विचार करता है, ऊर्जा खपत और गोपनीयता संरक्षण के बीच व्यापार-बंद अनुकूलन मॉडल स्थापित करता है।
पेपर कई महत्वपूर्ण कार्यों का हवाला देता है, जिनमें शामिल हैं:
LoRA मूल पेपर Hu et al., ICLR 2021
CKKS होमोमॉर्फिक एन्क्रिप्शन योजना Cheon et al., 2017
BERT मॉडल Devlin et al., 2018
संबंधित गोपनीयता-संरक्षण गहन शिक्षा कार्य
समग्र मूल्यांकन: यह तकनीकी नवाचार, सैद्धांतिक विश्लेषण और प्रायोगिक सत्यापन के सभी पहलुओं में उत्कृष्ट प्रदर्शन करने वाला एक उच्च-गुणवत्ता वाला अनुसंधान पेपर है। हालांकि कुछ सीमाएं हैं, लेकिन यह गोपनीयता-संरक्षण AI क्षेत्र के लिए महत्वपूर्ण अनुसंधान दिशा खोलता है, जिसमें महत्वपूर्ण शैक्षणिक मूल्य और अनुप्रयोग संभावनाएं हैं।