PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models
Li, Yu, Zhao
AI foundation models have recently demonstrated impressive capabilities across a wide range of tasks. Fine-tuning (FT) is a method of customizing a pre-trained AI foundation model by further training it on a smaller, targeted dataset. In this paper, we initiate the study of the Privacy-Preserving Parameter-Efficient FT (P3EFT) framework, which can be viewed as the intersection of Parameter-Efficient FT (PEFT) and Privacy-Preserving FT (PPFT). PEFT modifies only a small subset of the model's parameters to achieve FT (i.e., adapting a pre-trained model to a specific dataset), while PPFT uses privacy-preserving technologies to protect the confidentiality of the model during the FT process. There have been many studies on PEFT or PPFT but very few on their fusion, which motivates our work on P3EFT to achieve both parameter efficiency and model privacy. To exemplify our P3EFT, we present the PrivTuner scheme, which incorporates Fully Homomorphic Encryption (FHE) enabled privacy protection into LoRA (short for ``Low-Rank Adapter''). Intuitively speaking, PrivTuner allows the model owner and the external data owners to collaboratively implement PEFT with encrypted data. After describing PrivTuner in detail, we further investigate its energy consumption and privacy protection. Then, we consider a PrivTuner system over wireless communications and formulate a joint optimization problem to adaptively minimize energy while maximizing privacy protection, with the optimization variables including FDMA bandwidth allocation, wireless transmission power, computational resource allocation, and privacy protection. A resource allocation algorithm is devised to solve the problem. Experiments demonstrate that our algorithm can significantly reduce energy consumption while adapting to different privacy requirements.
academic
সম্পূর্ণ সমরূপী এনক্রিপশন এবং LoRA সহ PrivTuner: AI ভিত্তি মডেলের গোপনীয়তা-সংরক্ষণকারী প্যারামিটার-দক্ষ সূক্ষ্ম-সুরক্ষার জন্য একটি P3EFT স্কিম
এই গবেষণাপত্রটি গোপনীয়তা-সংরক্ষণকারী প্যারামিটার-দক্ষ সূক্ষ্ম-সুরক্ষা (P3EFT) কাঠামো প্রস্তাব করে, যা প্যারামিটার দক্ষ সূক্ষ্ম-সুরক্ষা (PEFT) এবং গোপনীয়তা-সংরক্ষণকারী সূক্ষ্ম-সুরক্ষা (PPFT) একত্রিত করে। লেখকরা PrivTuner স্কিম ডিজাইন করেছেন, যা সম্পূর্ণ সমরূপী এনক্রিপশন (FHE) কে LoRA তে একীভূত করে, মডেল মালিক এবং বাহ্যিক ডেটা মালিকদের মধ্যে সহযোগিতামূলক গোপনীয়তা-সংরক্ষণকারী সূক্ষ্ম-সুরক্ষা অর্জন করে। গবেষণাপত্রটি আরও বেতার যোগাযোগ পরিবেশে PrivTuner সিস্টেম বিবেচনা করে, শক্তি খরচ কমানোর সময় গোপনীয়তা সুরক্ষা সর্বাধিক করার জন্য একটি যৌথ অপ্টিমাইজেশন সমস্যা স্থাপন করে এবং সংশ্লিষ্ট সম্পদ বরাদ্দ অ্যালগরিদম প্রস্তাব করে।
গোপনীয়তা সুরক্ষার প্রয়োজনীয়তা: AI ভিত্তি মডেলের সূক্ষ্ম-সুরক্ষা প্রক্রিয়ায় ডেটা গোপনীয়তা এবং মডেল গোপনীয়তার সমস্যা রয়েছে। এন্টারপ্রাইজগুলি ব্যক্তিগত ডেটা শেয়ার করতে অনিচ্ছুক, এবং একই সাথে মডেল মালিকরা মডেল প্যারামিটার প্রকাশ করতে অনিচ্ছুক।
গণনা দক্ষতার চ্যালেঞ্জ: ঐতিহ্যবাহী সম্পূর্ণ-প্যারামিটার সূক্ষ্ম-সুরক্ষা বিশাল গণনা ওভারহেড তৈরি করে, বিশেষ করে বড় ভিত্তি মডেলের জন্য, স্থানীয় সূক্ষ্ম-সুরক্ষা সম্পদ-সীমিত ডিভাইসগুলির জন্য একটি বড় বোঝা তৈরি করে।
বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
PEFT পদ্ধতি গণনা বোঝা হ্রাস করে, কিন্তু গোপনীয়তা সুরক্ষা সমস্যা উপেক্ষা করে
PPFT পদ্ধতি গোপনীয়তা রক্ষা করতে পারে, কিন্তু সাধারণত অতিরিক্ত যোগাযোগ এবং গণনা ওভারহেড প্রবর্তন করে
বিদ্যমান গবেষণা প্রধানত PEFT বা PPFT এর পৃথক প্রয়োগের উপর দৃষ্টি নিবদ্ধ করে, উভয়ের সংমিশ্রণের পদ্ধতিগত গবেষণার অভাব রয়েছে। এই গবেষণাপত্রটি এই শূন্যতা পূরণের লক্ষ্য রাখে, P3EFT কাঠামো প্রস্তাব করে, সীমিত গণনা বাজেটের অধীনে গোপনীয়তা সুরক্ষা এবং প্যারামিটার দক্ষতার দ্বৈত লক্ষ্য অর্জন করে।
P3EFT কাঠামো প্রস্তাব: প্রথমবারের মতো PEFT এবং PPFT কে পদ্ধতিগতভাবে একত্রিত করে, দুটি গবেষণা ক্ষেত্রের মধ্যে ব্যবধান সেতু করে।
PrivTuner স্কিম ডিজাইন: CKKS সম্পূর্ণ সমরূপী এনক্রিপশন স্কিম এবং LoRA প্রযুক্তি একত্রিত করে, ডেটা এবং মডেল গোপনীয়তা রক্ষা করার সময় গণনা বোঝা হ্রাস করে নিরাপদ এবং দক্ষ সহযোগিতামূলক সূক্ষ্ম-সুরক্ষা অর্জন করে।
খরচ এবং গোপনীয়তা সুরক্ষা মডেল স্থাপন: সার্ভার এবং ডিভাইস দৃষ্টিকোণ থেকে সময় এবং শক্তি খরচ মডেল বিশ্লেষণ করে, গোপনীয়তা সুরক্ষা স্তরের পরিমাণগত সূচক প্রদান করে।
যৌথ অপ্টিমাইজেশন অ্যালগরিদম ডিজাইন: শাখা এবং বাউন্ড (B&B) এবং ভগ্নাংশ প্রোগ্রামিং কৌশল একত্রিত করে সম্পদ বরাদ্দ অ্যালগরিদম প্রস্তাব করে, গণনা ক্ষমতা, বেতার যোগাযোগ সম্পদ এবং FHE সেটিংসের যৌথ অপ্টিমাইজেশন সমস্যা কার্যকরভাবে সমাধান করে।
P3EFT কাজ সংজ্ঞায়িত করা হয়েছে: প্রাক-প্রশিক্ষিত ভিত্তি মডেল W₀ এবং ব্যক্তিগত ডেটাসেট দেওয়া, ডেটা গোপনীয়তা এবং মডেল গোপনীয়তা রক্ষা করার শর্তে, মডেল সূক্ষ্ম-সুরক্ষা অর্জনের জন্য শুধুমাত্র অল্প সংখ্যক প্যারামিটার আপডেট করা।
FHE এবং LoRA এর জৈব সমন্বয়: প্রথমবারের মতো CKKS সম্পূর্ণ সমরূপী এনক্রিপশন এবং LoRA প্রযুক্তি একত্রিত করে, এনক্রিপ্ট করা ডোমেইনে প্যারামিটার দক্ষ সূক্ষ্ম-সুরক্ষা অর্জন করে।
অ-রৈখিক ফাংশন পরিচালনা: Transformer মডেলে অ-রৈখিক ফাংশনের FHE পরিবেশে গণনা সমস্যা পদ্ধতিগতভাবে সমাধান করে।
সম্পদ অপ্টিমাইজেশন কাঠামো: বেতার যোগাযোগ পরিবেশে ব্যবহারিক সীমাবদ্ধতা বিবেচনা করে, শক্তি খরচ এবং গোপনীয়তা সুরক্ষার মধ্যে ভারসাম্য অপ্টিমাইজেশন মডেল স্থাপন করে।
গবেষণাপত্রটি একাধিক গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
LoRA মূল গবেষণাপত্র Hu et al., ICLR 2021
CKKS সমরূপী এনক্রিপশন স্কিম Cheon et al., 2017
BERT মডেল Devlin et al., 2018
সম্পর্কিত গোপনীয়তা-সংরক্ষণকারী গভীর শিক্ষা কাজ
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের গবেষণাপত্র, যা প্রযুক্তিগত উদ্ভাবন, তাত্ত্বিক বিশ্লেষণ এবং পরীক্ষামূলক যাচাইকরণে চমৎকার কর্মক্ষমতা প্রদর্শন করে। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এটি গোপনীয়তা-সংরক্ষণকারী AI ক্ষেত্রে গুরুত্বপূর্ণ গবেষণা দিকনির্দেশনা উন্মোচন করে এবং গুরুত্বপূর্ণ একাডেমিক মূল্য এবং প্রয়োগ সম্ভাবনা রয়েছে।