FedLoRA-Optimizer: Federated LoRA Fine-Tuning with Global and Local Optimization in Heterogeneous Data Scenarios
Zhao, Zhu, Zhang et al.
Federated efficient fine-tuning has emerged as an approach that leverages distributed data and computational resources across nodes to address the challenges of large-scale fine-tuning and privacy preservation. The Low-Rank Adaptation (LoRA) enables efficient fine-tuning of large-scale pre-trained models by introducing trainable low-rank matrices into weight updates.However, in heterogeneous data scenarios, client drift weakens the generalization of the global model, and local models often fail to meet the personalized needs of individual clients.Moreover, existing federated LoRA efficient fine-tuning techniques overlook fine-grained analysis of the tuning matrices. To address this, we conducted preliminary experiments and found that different LoRA matrices exhibit different sensitivity to changes in the direction and magnitude of their vectors.We thus propose a fine-grained federated LoRA tuning method. By fine-tuning the more sensitive directional vectors in the A matrix, which encode shared knowledge, our method learns shared features more effectively across clients and enhances global generalization. Simultaneously, by fine-tuning the more sensitive magnitude vectors in the B matrix, which encode personalized knowledge, our method better captures personalized knowledge, enabling detailed adaptation to local data. The method uses a pipeline combining global and local optimizers. Global optimization further improves local models, achieving collaborative optimization between global and local levels. This improves both the generalization ability of the global model and the personalized adaptation of local models under heterogeneous data scenarios. Experiments on Databricks-Dolly-15k and Natural Instructions with LLaMA2-7B and Deepseek-7B confirm that our method improves global performance by 0.39% and local performance by 0.59%.
academic
FedLoRA-Optimizer: الضبط الدقيق الموحد لـ LoRA مع التحسين العام والمحلي في سيناريوهات البيانات غير المتجانسة
يعالج الضبط الدقيق الموحد الفعال تحديات الضبط الدقيق على نطاق واسع وحماية الخصوصية من خلال الاستفادة من البيانات الموزعة والموارد الحسابية عبر العقد. يحقق التكيف منخفض الرتبة (LoRA) الضبط الدقيق الفعال للنماذج المدربة مسبقاً على نطاق واسع من خلال إدخال مصفوفات منخفضة الرتبة قابلة للتدريب في تحديثات الأوزان. ومع ذلك، في سيناريوهات البيانات غير المتجانسة، يضعف انجراف العميل القدرة على التعميم للنموذج العام، وغالباً ما تفشل النماذج المحلية في تلبية احتياجات التخصيص لكل عميل على حدة. علاوة على ذلك، تتجاهل تقنيات الضبط الدقيق الموحد الفعال الحالية لـ LoRA التحليل الدقيق لمصفوفات الضبط. لهذا السبب، أجرينا تجارب أولية وكتشفنا أن مصفوفات LoRA المختلفة تظهر حساسيات مختلفة تجاه التغييرات في اتجاه وحجم المتجهات. بناءً على هذا الاكتشاف، نقترح طريقة ضبط دقيق موحدة دقيقة الحبيبات تتعلم بشكل أكثر فعالية الميزات المشتركة عبر العملاء من خلال ضبط متجهات الاتجاه الأكثر حساسية التي تشفر المعرفة المشتركة في مصفوفة A، مما يعزز القدرة على التعميم العام؛ وفي الوقت نفسه، تلتقط بشكل أفضل المعرفة المخصصة من خلال ضبط متجهات الحجم الأكثر حساسية التي تشفر المعرفة المخصصة في مصفوفة B. تستخدم الطريقة بنية خط أنابيب تجمع بين محسّنات عامة ومحلية، مما يحسّن القدرة على التعميم للنموذج العام والتكيف الشخصي للنموذج المحلي في سيناريوهات البيانات غير المتجانسة.
مع الاستخدام الواسع للنماذج المدربة مسبقاً الكبيرة، أصبح كيفية إجراء ضبط دقيق موزع فعال مع حماية الخصوصية تحدياً رئيسياً. يوفر التعلم الموحد حلاً، لكنه يواجه مشاكل تدهور الأداء في سيناريوهات البيانات غير المتجانسة، مما يؤثر بشكل مباشر على فعالية النماذج الكبيرة في التطبيقات العملية.
اكتشف المؤلفون من خلال التجارب أن مصفوفات A و B في LoRA تظهر أنماط حساسية مختلفة تجاه التغييرات في الاتجاه والحجم، مما يوفر أساساً نظرياً لتصميم استراتيجيات تحسين موجهة.
التحليل التجريبي الدقيق: أول تحليل دقيق الحبيبات لتغييرات الاتجاه والحجم في مصفوفات ضبط LoRA، مع اكتشاف أن تغييرات الاتجاه في مصفوفة A تبلغ حوالي 1.7 مرة من مصفوفة B، بينما تغييرات الحجم في مصفوفة B تبلغ حوالي 41 مرة من مصفوفة A
طريقة ضبط دقيق موحدة دقيقة الحبيبات للبيانات غير المتجانسة: تقترح طريقة تحسّن بشكل منفصل متجهات الاتجاه عالية الحساسية في مصفوفة A ومتجهات الحجم عالية الحساسية في مصفوفة B، مما يعزز بشكل كبير القدرة على التعميم للنموذج العام والتكيف للنموذج المحلي
بنية تحسين عام-محلي متعاون: تصمم بنية خط أنابيب تجمع بين محسّنات عامة ومحلية، مما يحقق التحسين المتعاون على المستويات العام والمحلي
التحقق التجريبي: التحقق على نماذج LLaMA2-7B و Deepseek-7B باستخدام مجموعات بيانات Databricks-Dolly-15k و Natural Instructions، مع تحسن دقة المهام العامة بحوالي 0.39% وتحسن المهام المحلية بحوالي 0.59%
تدرس هذه الورقة مهمة الضبط الدقيق الفعال لنماذج اللغة الكبيرة في بيئة التعلم الموحد. بالنظر إلى N عميل، حيث يمتلك كل عميل i مجموعة بيانات محلية Di، الهدف هو تدريب نموذج يتمتع بقدرة تعميم عام جيدة ويلبي احتياجات التخصيص لكل عميل، دون مشاركة البيانات الأصلية.
التحقق من الحساسية المختلفة للاتجاه مقابل الحجم: تم التحقق من أن تغييرات اتجاه مصفوفة A أكبر بالفعل من مصفوفة B بحوالي 1.7 مرة، وتغييرات حجم مصفوفة B أكبر من مصفوفة A بحوالي 41 مرة
ضرورة بنية خط الأنابيب: التحسين المحلي بعد التحسين العام أفضل من التحسين المحلي المباشر
أهمية إعدادات المعاملات: لإعدادات rank المناسبة تأثير كبير على الأداء
قيمة التحليل الدقيق: يكشف التحليل الدقيق الحبيبات لتغييرات الاتجاه والحجم في مصفوفات LoRA عن أنماط فروقات حساسية مهمة
فعالية استراتيجيات التحسين المختلفة: استراتيجيات التحسين المختلفة الموجهة لمتجهات الاتجاه في مصفوفة A ومتجهات الحجم في مصفوفة B قادرة على تحسين القدرة على التعميم العام والقدرة على التخصيص المحلي في نفس الوقت
مزايا بنية خط الأنابيب: التحسين المتعاون العام-المحلي أكثر فعالية من التحسين المحلي البحت
تستشهد الورقة بـ 25 مرجعاً ذا صلة، تغطي الأعمال المهمة في المجالات الرئيسية لـ LoRA والتعلم الموحد والضبط الدقيق الفعال للمعاملات، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الإجمالي: هذا عمل قيّم في مجال التقاطع بين التعلم الموحد والضبط الدقيق الفعال للمعاملات. بينما تحسن الأداء محدود نسبياً، فإن منظور التحليل الدقيق الحبيبات واستراتيجيات التحسين المختلفة التي تقترحها توفر منظوراً بحثياً جديداً للمجال، مع قيمة أكاديمية وإمكانية تطبيق عملي معينة.