ScaLoRA: Optimally Scaled Low-Rank Adaptation for Efficient High-Rank Fine-Tuning
Zhang, Yang, Cai et al.
As large language models (LLMs) continue to scale in size, the computational overhead has become a major bottleneck for task-specific fine-tuning. While low-rank adaptation (LoRA) effectively curtails this cost by confining the weight updates to a low-dimensional subspace, such a restriction can hinder effectiveness and slow convergence. This contribution deals with these limitations by accumulating progressively a high-rank weight update from consecutive low-rank increments. Specifically, the per update optimal low-rank matrix is identified to minimize the loss function and closely approximate full fine-tuning. To endow efficient and seamless optimization without restarting, this optimal choice is formed by appropriately scaling the columns of the original low-rank matrix. Rigorous performance guarantees reveal that the optimal scaling can be found analytically. Extensive numerical tests with popular LLMs scaling up to 12 billion parameters demonstrate a consistent performance gain and fast convergence relative to state-of-the-art LoRA variants on diverse tasks including natural language understanding, commonsense reasoning, and mathematical problem solving.
대규모 언어 모델(LLMs)의 규모가 계속 증가함에 따라 계산 비용이 작업별 미세조정의 주요 병목이 되었습니다. 저차수 적응(LoRA)은 가중치 업데이트를 저차원 부분공간으로 제한하여 비용을 효과적으로 감소시키지만, 이러한 제한은 성능을 저해하고 수렴 속도를 늦춥니다. 본 연구는 연속적인 저차수 증분을 점진적으로 누적하여 고차수 가중치 업데이트를 형성함으로써 이러한 한계를 해결합니다. 구체적으로, 손실 함수를 최소화하고 전체 미세조정에 밀접하게 근사하기 위해 각 업데이트의 최적 저차수 행렬을 식별합니다. 재시작 없이 효율적이고 원활한 최적화를 달성하기 위해, 이러한 최적 선택은 원본 저차수 행렬의 열을 적절히 스케일링하여 형성됩니다. 엄격한 성능 보장은 최적 스케일링을 분석적 방법으로 찾을 수 있음을 보여줍니다. 120억 개 매개변수까지의 인기 있는 LLMs에서 수행한 광범위한 수치 테스트는 자연어 이해, 상식 추론, 수학 문제 해결 등 다양한 작업에서 최첨단 LoRA 변형에 비해 일관된 성능 향상과 빠른 수렴을 달성함을 보여줍니다.
대규모 언어 모델의 규모가 빠르게 증가함에 따라 기존의 전체 미세조정 방법은 막대한 계산 부담으로 인해 점점 더 실행 불가능해지고 있습니다. 예를 들어, Llama 4 Scout의 최소 변형도 1090억 개의 매개변수를 포함하며, 반정밀도를 사용하더라도 전체 미세조정에는 1TB 이상의 GPU 메모리와 상당한 시간이 필요합니다.
논문은 LoRA 및 그 변형, 매개변수 효율적 미세조정, 대규모 언어 모델 등 관련 분야의 중요한 작업을 포함하는 62개의 관련 문헌을 인용하여 연구에 견고한 이론적 기초를 제공합니다.
요약: ScaLoRA는 이론과 실무 모두에서 중요한 기여를 하는 작업으로, 영리한 수학적 분석을 통해 LoRA의 핵심 한계를 해결하고 계산 효율성을 유지하면서 현저한 성능 향상을 달성합니다. 이 방법은 대규모 언어 모델의 매개변수 효율적 미세조정을 위한 새로운 아이디어와 도구를 제공합니다.