FedLoRA-Optimizer: Federated LoRA Fine-Tuning with Global and Local Optimization in Heterogeneous Data Scenarios
Zhao, Zhu, Zhang et al.
Federated efficient fine-tuning has emerged as an approach that leverages distributed data and computational resources across nodes to address the challenges of large-scale fine-tuning and privacy preservation. The Low-Rank Adaptation (LoRA) enables efficient fine-tuning of large-scale pre-trained models by introducing trainable low-rank matrices into weight updates.However, in heterogeneous data scenarios, client drift weakens the generalization of the global model, and local models often fail to meet the personalized needs of individual clients.Moreover, existing federated LoRA efficient fine-tuning techniques overlook fine-grained analysis of the tuning matrices. To address this, we conducted preliminary experiments and found that different LoRA matrices exhibit different sensitivity to changes in the direction and magnitude of their vectors.We thus propose a fine-grained federated LoRA tuning method. By fine-tuning the more sensitive directional vectors in the A matrix, which encode shared knowledge, our method learns shared features more effectively across clients and enhances global generalization. Simultaneously, by fine-tuning the more sensitive magnitude vectors in the B matrix, which encode personalized knowledge, our method better captures personalized knowledge, enabling detailed adaptation to local data. The method uses a pipeline combining global and local optimizers. Global optimization further improves local models, achieving collaborative optimization between global and local levels. This improves both the generalization ability of the global model and the personalized adaptation of local models under heterogeneous data scenarios. Experiments on Databricks-Dolly-15k and Natural Instructions with LLaMA2-7B and Deepseek-7B confirm that our method improves global performance by 0.39% and local performance by 0.59%.
academic
FedLoRA-Optimizer: Федеративная тонкая настройка LoRA с глобальной и локальной оптимизацией в сценариях гетерогенных данных
Федеративная эффективная тонкая настройка решает проблемы крупномасштабной тонкой настройки и защиты конфиденциальности путем использования распределённых данных и вычислительных ресурсов между узлами. Адаптация низкого ранга (LoRA) обеспечивает эффективную тонкую настройку крупномасштабных предварительно обученных моделей путём введения обучаемых матриц низкого ранга в обновления весов. Однако в сценариях гетерогенных данных дрейф клиентов ослабляет способность глобальной модели к обобщению, а локальные модели часто не могут удовлетворить индивидуальные потребности отдельных клиентов. Кроме того, существующие методы федеративной эффективной тонкой настройки LoRA игнорируют детальный анализ матриц настройки. В данной работе проведены предварительные эксперименты, выявившие, что различные матрицы LoRA проявляют различную чувствительность к изменениям направления и амплитуды их векторов. На основе этого открытия предлагается детальный метод федеративной настройки LoRA, который более эффективно изучает общие характеристики между клиентами путём настройки более чувствительных векторов направления, кодирующих общие знания в матрице A, что повышает способность глобального обобщения; одновременно лучше захватывает персонализированные знания путём настройки более чувствительных векторов амплитуды, кодирующих персонализированные знания в матрице B. Метод использует архитектуру конвейера, объединяющую глобальный и локальный оптимизаторы, улучшая способность глобальной модели к обобщению и адаптивность локальной модели к персонализации в сценариях гетерогенных данных.
Основные проблемы, решаемые в данной работе, включают:
Проблема дрейфа клиентов: Различия в распределении данных между клиентами в среде федеративного обучения с гетерогенными данными приводят к снижению способности глобальной модели к обобщению
Недостаточность персонализации: Локальные модели не могут хорошо удовлетворить индивидуальные потребности каждого клиента
Отсутствие детального анализа: Существующие методы игнорируют тонкий анализ матриц настройки LoRA
С широким применением крупных предварительно обученных моделей эффективная распределённая тонкая настройка при сохранении конфиденциальности становится ключевым вызовом. Федеративное обучение предоставляет решение, но сталкивается с деградацией производительности в сценариях гетерогенных данных, что напрямую влияет на эффективность крупных моделей в практических приложениях.
Традиционные методы федеративного обучения: Такие как FedAvg, испытывают трудности с конвергенцией при гетерогенности данных, что приводит к снижению точности
Существующие методы федеративного LoRA: Сосредоточены в основном на проектировании архитектуры модели, но не проводят детальный анализ изменений матриц настройки
Методы параметрической эффективности: Хотя и снижают затраты на коммуникацию, баланс между глобальным обобщением и персональной адаптацией в гетерогенной среде остаётся сложным
Авторы обнаружили через эксперименты, что матрицы A и B LoRA проявляют различные модели чувствительности к изменениям направления и амплитуды, что обеспечивает теоретическую основу для разработки целевых стратегий оптимизации.
Детальный эмпирический анализ: Впервые проведён детальный анализ изменений направления и амплитуды матриц настройки LoRA, выявивший, что изменения направления матрицы A примерно в 1,7 раза больше, чем матрицы B, а изменения амплитуды матрицы B примерно в 41 раз больше, чем матрицы A
Детальный метод федеративной тонкой настройки для гетерогенных данных: Предложен метод отдельной оптимизации высокочувствительных векторов направления в матрице A и высокочувствительных векторов амплитуды в матрице B, значительно повышающий способность глобальной модели к обобщению и адаптивность локальной модели
Архитектура совместной глобально-локальной оптимизации: Разработана архитектура конвейера, объединяющая глобальный и локальный оптимизаторы, обеспечивающая совместную оптимизацию на глобальном и локальном уровнях
Экспериментальная верификация: Проведена верификация на моделях LLaMA2-7B и Deepseek-7B с использованием наборов данных Databricks-Dolly-15k и Natural Instructions, показавшая повышение точности глобальных задач примерно на 0,39% и локальных задач примерно на 0,59%
В данной работе исследуется задача эффективной тонкой настройки больших языковых моделей в среде федеративного обучения. Учитывая N клиентов, каждый из которых обладает локальным набором данных Di, целью является обучение модели, которая не требует совместного использования исходных данных, но обладает как хорошей способностью к глобальному обобщению, так и удовлетворяет индивидуальные потребности каждого клиента.
Дифференцированная оптимизация на основе чувствительности: В соответствии с различной чувствительностью матриц A и B к изменениям направления и амплитуды применяются целевые стратегии оптимизации
Проектирование архитектуры конвейера: Глобальный оптимизатор сначала обучает глобальную модель, затем локальный оптимизатор выполняет персонализированную настройку на основе глобальной модели
Детальное управление параметрами: Отдельное управление обновлениями векторов направления и амплитуды обеспечивает более тонкую настройку параметров
Анализ различных настроек ранга показал, что модель достигает оптимальной производительности при r=8, n=2, с точностью 18,59% на задаче причинно-следственного рассуждения.
Верификация дифференцированной чувствительности направления и амплитуды: Подтверждено, что изменения направления матрицы A действительно примерно в 1,7 раза больше, чем матрицы B, а изменения амплитуды матрицы B примерно в 41 раз больше, чем матрицы A
Необходимость архитектуры конвейера: Локальная оптимизация после глобальной оптимизации показывает лучшие результаты, чем прямая локальная оптимизация
Важность настройки параметров: Надлежащая настройка ранга оказывает значительное влияние на производительность
Ценность детального анализа: Детальный анализ изменений направления и амплитуды матриц LoRA выявляет важные модели различной чувствительности
Эффективность дифференцированных стратегий оптимизации: Дифференцированные стратегии оптимизации для векторов направления матрицы A и векторов амплитуды матрицы B могут одновременно повысить как глобальное обобщение, так и локальную персонализацию
Преимущества архитектуры конвейера: Совместная глобально-локальная оптимизация более эффективна, чем чистая локальная оптимизация
Авторы предлагают в будущем исследовать стратегии оптимизации для повышения адаптивности модели в гетерогенной среде и эффективности тонкой настройки, включая:
Инновационные теоретические идеи: Впервые проведён анализ различий чувствительности матриц LoRA с детальной точки зрения, обеспечивающий теоретическую основу для стратегий оптимизации
Разумное проектирование метода: Дифференцированные стратегии оптимизации, разработанные на основе эмпирических наблюдений, обладают высокой обоснованностью
Полный дизайн экспериментов: Включает достаточное количество сравнительных экспериментов, анализ параметров и абляционные исследования
Чёткое определение проблемы: Точное выявление ключевых вызовов в федеративной тонкой настройке LoRA
Статья цитирует 25 связанных работ, охватывающих ключевые области LoRA, федеративного обучения и параметрически эффективной тонкой настройки, обеспечивая прочную теоретическую основу для исследования.
Общая оценка: Это ценная работа в области пересечения федеративного обучения и параметрически эффективной тонкой настройки. Хотя прирост производительности относительно ограничен, предложенная детальная перспектива анализа и дифференцированные стратегии оптимизации предоставляют новые идеи исследований для данной области и обладают определённой академической ценностью и практическим потенциалом.