PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
PrivTuner مع التشفير الكامل المتماثل و LoRA: مخطط P3EFT لضبط دقيق فعال في المعاملات مع الحفاظ على الخصوصية لنماذج أساس الذكاء الاصطناعي
تقترح هذه الورقة إطار عمل الضبط الدقيق الفعال في المعاملات مع الحفاظ على الخصوصية (P3EFT)، الذي يجمع بين الضبط الدقيق الفعال في المعاملات (PEFT) والضبط الدقيق الفعال مع الحفاظ على الخصوصية (PPFT). صمم المؤلفون مخطط PrivTuner، الذي يدمج التشفير الكامل المتماثل (FHE) في LoRA، مما يحقق ضبطاً دقيقاً تعاونياً مع الحفاظ على الخصوصية بين مالك النموذج ومالكي البيانات الخارجيين. تأخذ الورقة في الاعتبار أيضاً نظام PrivTuner في بيئة الاتصالات اللاسلكية، وتؤسس مشكلة تحسين مشتركة لتقليل استهلاك الطاقة مع تعظيم الحفاظ على الخصوصية، وتقترح خوارزمية تخصيص الموارد المقابلة.
متطلبات الحفاظ على الخصوصية: توجد مشاكل خصوصية البيانات وخصوصية النموذج في عملية ضبط نماذج أساس الذكاء الاصطناعي. الشركات غير راغبة في مشاركة البيانات الخاصة، وفي الوقت نفسه، مالكو النماذج غير راغبين في الكشف عن معاملات النموذج.
تحديات الكفاءة الحسابية: يتطلب الضبط الدقيق الكامل للمعاملات تكاليف حسابية ضخمة، خاصة بالنسبة للنماذج الأساسية الكبيرة، حيث يشكل الضبط الدقيق المحلي عبئاً كبيراً على الأجهزة ذات الموارد المحدودة.
قيود الطرق الموجودة:
تقلل طرق PEFT من العبء الحسابي، لكنها تتجاهل مشاكل الحفاظ على الخصوصية
يمكن لطرق PPFT حماية الخصوصية، لكنها عادة ما تقدم تكاليف اتصال وحسابية إضافية
يركز البحث الموجود بشكل أساسي على التطبيق المنفصل لـ PEFT أو PPFT، مع نقص الدراسات المنهجية لدمج الاثنين معاً. تهدف هذه الورقة إلى ملء هذه الفجوة، وتقترح إطار عمل P3EFT لتحقيق الأهداف المزدوجة للحفاظ على الخصوصية والكفاءة في المعاملات ضمن ميزانية حسابية محدودة.
اقتراح إطار عمل P3EFT: يجمع بشكل منهجي لأول مرة بين PEFT و PPFT، مما يسد الفجوة بين مجالي البحث.
تصميم مخطط PrivTuner: يدمج مخطط CKKS للتشفير الكامل المتماثل مع تقنية LoRA، مما يحقق ضبطاً دقيقاً تعاونياً آمناً وفعالاً، مع حماية خصوصية البيانات والنموذج وتقليل العبء الحسابي.
إنشاء نماذج الاستهلاك والحفاظ على الخصوصية: يحلل نماذج الوقت واستهلاك الطاقة من منظور الخادم والجهاز، مما يوفر مؤشرات كمية لمستويات الحفاظ على الخصوصية.
تصميم خوارزمية تحسين مشتركة: يقترح خوارزمية تخصيص موارد تجمع بين تقنيات الفرع والحد (B&B) والبرمجة الكسرية، مما يحل بشكل فعال مشكلة التحسين المشترك للقدرة الحسابية وموارد الاتصالات اللاسلكية وإعدادات FHE.
تُعرّف مهمة P3EFT على النحو التالي: بالنظر إلى نموذج أساس مدرب مسبقاً W₀ ومجموعة بيانات خاصة، تحديث عدد قليل من المعاملات فقط لتحقيق ضبط دقيق للنموذج مع حماية خصوصية البيانات وخصوصية النموذج.
أعمال ذات صلة في التعلم العميق مع الحفاظ على الخصوصية
التقييم الشامل: هذه ورقة بحثية عالية الجودة، تتميز بأداء ممتازة من حيث الابتكار التقني والتحليل النظري والتحقق التجريبي. على الرغم من وجود بعض القيود، فإنها تفتح اتجاهاً بحثياً مهماً في مجال الذكاء الاصطناعي مع الحفاظ على الخصوصية، وتتمتع بقيمة أكاديمية وآفاق تطبيقية مهمة.