Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation
Peng, Kumar, Wu et al.
Retrieval-Augmented Generation (RAG) systems leverage Large Language Models (LLMs) to generate accurate and reliable responses that are grounded in retrieved context. However, LLMs often generate inconsistent outputs for semantically equivalent inputs, a problem compounded by the scarcity of consistency-focused training data and the limitations of current fine-tuning techniques in enhancing output consistency. We propose a new approach combining systematic synthetic data generation, triplet loss for better embeddings, and a novel layer-wise model merging approach. Using consistency-aware weights derived from intermediate layer activations, our method effectively integrates knowledge from specialized models. Experimental results how that our merged model significantly enhances output consistency, achieving a ~47.5\% improvement in response similarity over the baseline, thus offering a practical solution for increasing the reliability of an industrial RAG system.
검색 증강 생성(RAG) 시스템은 대규모 언어 모델(LLMs)을 활용하여 검색된 맥락을 기반으로 정확하고 신뢰할 수 있는 응답을 생성합니다. 그러나 LLMs는 의미론적으로 동등한 입력에 직면할 때 종종 불일치한 출력을 생성하며, 이 문제는 일관성 지향 훈련 데이터의 부족과 현재 미세 조정 기술의 출력 일관성 강화 측면의 한계로 인해 악화됩니다. 본 논문은 체계적인 합성 데이터 생성, 삼중항 손실 및 새로운 계층별 모델 병합을 결합한 방법을 제안합니다. 중간층 활성화에서 도출된 일관성 인식 가중치를 사용함으로써, 이 방법은 특화된 모델의 지식을 효과적으로 통합합니다. 실험 결과는 병합 모델이 출력 일관성을 크게 향상시켰으며, 응답 유사성에서 기준선 대비 47.5%의 개선을 달성했음을 보여줍니다.
Yu et al. (2024), Yadav et al. (2023): DARE-TIES 모델 병합 방법
Schroff et al. (2015): 삼중항 손실의 원본 연구
Patwardhan et al. (2024): LLM 일관성의 정의 및 분석
전체 평가: 이는 실제 산업 문제를 다루는 고품질 응용 연구 논문으로, 방법 혁신성과 실용적 가치 측면에서 모두 현저한 기여를 하고 있습니다. 이론적 깊이와 일반화 검증 측면에서 개선의 여지가 있지만, 해결하는 문제의 중요한 실제 의의와 제안된 방법의 우수한 조작성 및 유효성을 고려할 때 가치 있는 연구입니다.